








作者 在 Freescale 公 司 从 事 数 字 电 路 设计 多 年 ， 拥 有 丰富 的 设计 经 验 。 
上 首 本 以 专题 方式 梳理 数字 电路 设计 技术 的 书籍 ， 数 字 电 路 设计 领域 的 打黑 之 作 。 ee 


华章 科技 ” 选 图 丰富 ， 初 学 者 与 中 高 级 读者 都 能 够 通过 本 书 完善 和 提高 自己 的 知识 结构 。 
低 功 耗 、 消 拌 、 电 磁 兼 容 等 内 容 在 一 般 的 书 中 都 鲜 有 涉及 。 电子 与 嵌入 式 系统 
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本 书 揭 示 硬 件 架 构 的 设计 艺术 ， 涵 盖 作 者 从 事 芯片 设计 行业 十 多 年 的 经 验 和 研究 成 果 。 本 书 共 分 9 章 ， 第 1 瘟 介 
绍 亚 稳 态 的 概念 、 量 化 方法 和 减少 其 影响 的 技术 ; 第 2 章 介 绍 同步 设计 的 时 钟 技 术 ， 并 提出 可 行 的 时 钟 方案 以 及 系统 
复位 策略 。 第 3 章 介绍 在 设计 中 使 用 异步 时 钟 或 “处 理 多 个 时 钟 ” 时 会 出 现 的 问题 及 解决 方法 。 第 4 童 介绍 时 钟 分 频 
器 的 各 个 方面 和 实现 方法 。 第 5 章 讲述 低 功 耗 设 计 技 术 ， 以 减少 动态 和 静态 功 耗 。 第 6 章 介绍 如 何 把 流水 线 技术 应 用 
在 处 理 器 的 设计 中 ， 从 而 提高 性 能 ; 第 7 章 讨论 使 用 最 佳 字 节 顺 序 的 方法 ;第 8 章 阐 述 去 拌 动 技术 ， 以 消除 毛刺 和 品 
声 。 第 9 章 介绍 电磁 干扰 的 原理 、 规 程 、 标 准 和 认证 ， 以 及 电磁 干扰 的 影响 因素 和 减少 电磁 干扰 的 方法 。 
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我 从 2006 年 开始 接触 芯片 设计 行业 , 在 近 7 年 的 工作 过 程 中 ， 深 刻 体会 到 了 这 个 行业 在 
市 场 、 技 术 和 从 业 人 员 规 模 上 急速 的 扩张 与 变化 所 产生 的 强烈 的 爆发 感 。 市 场 热点 层出不穷 ， 
生产 工艺 、 设 计 技 术 和 EDA 工具 的 飞速 进步 ， 以 及 国内 IC 公司 如 雨后春笋 般 的 涌现 和 对 人 才 
的 大 量 需 求 ， 使 这 个 行业 在 大 多 数 时 间 处 于 一 种 加 速 的 状态 中 。 而 作为 一 名 技术 人 员 ， 在 开 
始 的 几 年 里 ， 在 加 速 推力 和 有 限 技术 积累 的 阻力 这 对 矛盾 中 ， 尤 其 能 体会 到 其 中 的 激动 和 迷 
茫 。 在 edacn (现在 已 关闭 ) 、eetop 和 国外 一 些 专业 网 站 上 长 期 交流 的 日 子 里 ， 我 认识 了 许多 
同行 的 朋友 ， 有 国内 的 ， 有 国外 的 ， 大 家 普遍 的 共识 是 专业 资料 既 太 多 ， 又 太 少 。 太 多 是 指 
相对 于 初学 者 ， 所 关注 的 主题 往往 能 找到 无 数 的 文章 论文 和 技术 文档 ， 太 少 是 指 对 于 高 级 技 
术 人 员 ， 真 正 能 将 设计 提高 一 个 层次 的 关键 技术 要 点 ， 很 难 直接 遇 到 。 这 样 的 技术 要 点 往往 
需要 资深 工程 师 系 统 的 经 验 总 结 ， 这 正 是 国内 IC 业界 所 欠缺 的 。 

在 机 械 工业 出 版 社 的 张国强 编辑 的 推荐 下 ， 我 接触 到 了 本 书 。 从 头 到 尾 读 过 这 本 书后 ， 
我 的 第 一 感觉 就 是 ， 实 用 且 有 效 。 作 者 尽 可 能 用 最 少 的 理论 基础 作 铺 垫 ， 系 统 打 造 出 一 蛋 
由 实用 技术 组 成 的 大 厦 ， 其 工程 师 的 思维 方式 在 这 里 展现 无 余 ， 一 切 从 解决 问题 出 发 ， 直 
奔 主 题解 释 怎 样 做 ， 并 给 出 原理 图 和 代码 ， 以 及 解决 方案 。 简 洁 而 专注 ， 这 就 是 本 书 的 
风格 。 使 用 本 书 可 以 快速 解决 设计 中 可 能 遇 到 的 问题 ， 也 可 以 很 容易 地 将 本 书 的 内 容 直 接 
应 用 到 设计 中 。 

本 书 的 主要 内 容 涉 及 时 钟 和 复位 、 多 时 钟 域 设计 、 时 钟 分 频 器 、 低 功 耗 设计 技术 、 流 水 
线 技 术 、 字 节 顺 序 、 消 拌 技 术 和 电磁 兼容 性 等 方面 。 绝 大 部 分 内 容 是 进行 数字 设计 时 必然 会 
接触 到 的 。 但 也 有 一 些 技术 在 进行 某 些 特殊 部 分 设计 时 才 会 涉及 ， 如 销 幸 技 术 和 电磁 兼容 性 。 
第 2 章 介绍 同步 设计 的 时 钟 技术 ， 并 提出 了 可 行 的 时 钟 方案 ， 此 外 也 介绍 了 系统 复位 策略 。 
第 3 章 介绍 多 时 钟 设计 的 问题 和 处 理 方 法 ， 几 种 可 能 的 跨 时 钟 域 情况 和 跨 时 钟 域 数 据 传输 方 
法 等 。 第 4 章 介绍 奇数 、 侦 数 与 小 数 分 频 电 路 的 实现 和 优 缺 点 。 第 5 章 介绍 数字 电路 功 耗 来 
源 ， 并 分 别 从 系统 级 、 体 系 结构 级 、 寄 存 器 传输 级 和 晶体 管 级 提出 一 系列 降低 功 耗 的 方法 。 
第 6 章 介绍 流水 线 的 基本 原理 。 第 7 章 说 明 小 端 和 大 端 字 节 顺序 的 含义 ， 并 比较 其 优 缺点 和 适 
用 领域 ， 以 及 在 进行 系统 设计 时 处 理 使 用 不 同 字 节 顺 序 人 P 的 方法 ， 此 外 介绍 了 字 节 顺序 中 性 
编码 规则 。 第 8 章 介绍 典型 的 开关 行为 和 软 硬 件 消 抖 技术 。 第 9 章 介绍 电磁 干扰 的 原理 、 规 


程 、 标 准 和 认证 ， 电 磁 干 扰 的 影响 因素 及 减少 电磁 干扰 的 方法 。 

本 书 第 1 ~7 章 由 李 海 东 翻 译 ， 第 8 ~ 9 章 由 来 萍 、 师 谦和 肖 庆 中 负责 翻译 。 此 外 ， 感 
谢 同事 李 坤 在 模拟 电路 方面 、 曹 杰 和 和 詹 东 友 在 数字 电路 方面 对 我 的 帮助 与 支持 。 最 重要 的 ， 
感谢 家 人 对 我 的 理解 和 支持 ， 如 果 没 有 他 们 的 鼓励 我 无 法 在 节假日 坚持 每 天 起 早 贪 黑 的 翻 
译本 人 5 

由 于 译 者 水 平 有 限 ， 翻 译 中 难免 有 错误 或 不 妥 之 处 ， 此 外 也 可 能 偏向 于 自己 的 工作 经 验 ， 
真诚 希望 各 位 读者 在 阅读 本 书 时 能 将 发 现 的 错误 及 时 告知 ， 以 便 进行 更 正 。 


李 海 东 


亚 
了 


我 从 2000 年 起 开始 进入 芯片 设计 行业 。 工 作 中 涉及 的 众多 研究 使 我 有 机 会 编写 相关 的 技 
术 论 文 ， 参 加 各 种 技术 会 议 并 分 享 实践 经 验 。 在 这 个 过 程 中 ,我 的 出 版 物 得 到 了 许多 反馈 。 
常常 有 读者 希望 我 能 将 所 有 的 实践 经 验 汇集 成 一 本 书 。 然 后 这 本 书 问 世 了 。 本 书 重 点 强调 了 
卫 设计 者 在 设计 高 度 优 化 和 可 靠 的 数字 电路 时 所 要 面 对 的 任务 与 要 掌握 的 所 有 技巧 。 如 果 人 恰 
当 使 用 本 书 中 提 到 的 技术 ， 将 大 大 减少 将 最 初 设想 转化 为 实际 设计 所 用 的 时 间 ， 并 能 保证 一 
次 流 片 成 功 。 

本 书 读者 广泛 。 本 书 主要 面向 半导体 行业 中 的 需要 深入 理解 相关 主题 的 芯片 设计 人 员 ， 
此 外 本 书 也 可 以 作为 本 科 生 或 研究 生 的 教材 。 

本 书 与 同类 书籍 的 区 别 在 于 本 书 主 要 关注 芯片 设计 各 领域 中 所 遇 到 的 实际 问题 ， 而 不 仅 
仅 停 留 在 理论 概念 层面 。 

本 书 介 绍 芯片 设计 中 各 方面 的 顺序 如 下 : 从 第 1 章 介 绍 基 本 概念 开始 ， 逐 步 增 加 深度 到 
达 更 高 级 的 主题 。 如 EMC 设计 技术 或 复杂 的 低 功 耗 设计 技术 , 如 DVFS (Dynamic Voltage and 
Frequency Scaling， 动 态 电压 频率 调整 )。 

第 1 章 介 绍 “ 亚 稳 态 ”， 可 以 使 读者 对 其 有 更 为 清晰 的 理解 ， 涉 及 量化 的 方法 和 减少 其 影 
响 的 技术 。 

第 2 章 围绕 设计 人 员 在 设计 模块 或 知识 产权 (下) 时 使 用 的 “时 钟 和 复位 ”提出 一 系列 
建议 。 这 些 规 则 独立 于 任何 CAD 工具 或 硅 工艺 并 可 应 用 于 任意 ASIC 设计 。 

第 3 章 介绍 在 设计 中 使 用 异步 时 钟 或 “处 理 多 个 时 钟 ”时 会 出 现 的 问题 及 解决 方法 ， 以 
使 设计 能 在 多 时 钟 域 中 稳定 工作 。 

第 4 章 介 绍 “ 时 钟 分 频 器 ”的 各 个 方面 ， 这 是 可 能 需要 产生 若干 个 与 相位 相关 的 时 钟 的 
典型 SoC。 除 了 以 2 为 容 的 同步 分 频 ， 该 章 也 介绍 了 奇数 分 频 (3 分 频 、5 分 频 等 ) ， 以 及 非 整 
数 分 频 (1.5 分 频 、2. 5 分 频 等 ) 。 

第 5 章 介绍 “ 低 功 耗 设计 技术 ”。 随 着 工艺 节点 变 小 和 应 用 环境 对 功 耗 要 求 的 提高 ， 功 耗 
间 题 逐渐 成 为 设计 的 显著 约束 条 件 。 该 章 在 各 种 设计 抽象 级 上 提出 了 多 种 设计 方法 学 和 技术 ， 
来 减少 动态 和 静态 功 耗 。 

第 6 章 介绍 “流水 线 ” 技 术 。 将 这 种 技术 应 用 在 处 理 器 的 设计 中 ， 能 提高 单位 时 钟 的 数 


据 吞 吐 率 。 该 章 将 流水 线 概念 从 处 理 器 提高 到 典型 电路 中 ， 以 提高 性 能 。 

第 7 章 介绍 “ 字 节 顺序 ”的 概念 。 在 设计 中 各 种 下 可 能 有 不 同 的 字 节 顺序 ， 该 章 介绍 使 
用 最 优 字 节 顺序 的 方法 。 

第 8 章 介绍 硬件 和 软件 的 “ 消 拌 ” 方 法 ， 以 除 掉 从 外 部 输入 (通常 是 某 种 开关 ) 的 有 害 
噪声 和 毛刺 。 

第 9 章 深入 介绍 EMC/EMI 的 相关 问题 ， 将 其 应 用 于 数字 电路 的 方式 ， 以 及 为 达到 “更 好 
的 EMC 性 能 ”在 设计 的 各 抽象 级 所 要 遵循 的 设计 规则 。 

我 已 经 有 意 将 理论 部 分 尽 可 能 精简 ， 主 要 是 为 了 帮助 读者 对 各 专题 的 理解 。 各 章 中 所 提 
到 的 设计 准则 独立 于 任何 CAD 工具 或 硅 工 艺 ， 所 以 设计 者 可 在 设计 和 实施 任何 片上 系统 
(SoC) 项 目 时 使 用 它们 ， 以 得 到 结构 合理 且 可 综合 的 RIL 代码 。 

本 书 中 有 少量 的 章节 包含 硬件 描述 语言 (HDL) 代码 ， 主 要 是 针对 刚刚 接触 数字 电路 的 
初学 者 。 对 于 已 熟练 掌握 该 基础 的 高 级 工程 师 ， 此 部 分 可 以 直接 跳 过 。 

某 些 更 高 级 的 章节 ， 如 第 9 章 ， 在 撰写 时 经 过 了 几 个 月 的 透彻 研究 ， 以 使 其 更 易于 被 数 
字 设 计 人 员 接 受 。 

我 已 采取 了 各 种 措施 以 尽 可 能 保持 本 书 的 完善 性 。 欢 迎 广大 读者 针对 这 些 方面 提出 反馈 
或 建议 。 相 关 意 见 可 以 发 送 至 邮箱 : mohit arora@ me. com 或 mohit. arora@ freescale. com。 


致谢 


我 写本 书 的 初 囊 是 想 将 我 多 年 的 工作 经 验 和 所 进行 的 众多 研究 联系 起 来 。 然 而 ， 如 果 没 
有 其 他 人 的 大 力 支 持 和 帮助 ， 我 是 无 法 完成 这 样 一 本 书 的 。 

我 心爱 的 妻子 Pooja 经 常 在 深夜 耐心 陪伴 着 我 ， 真 心 感谢 她 对 我 的 真诚 支持 和 鼓励 。 我 的 
大 多 数 写作 工作 是 在 周末 、 夜 间 、 旅 途中 ， 以 及 其 他 本 属于 家 庭 生活 的 时 间 进 行 的 。 谢 谢 我 
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第 1 章 


亚 稳 态 的 世界 


1.1 简介 


在 同步 系统 中 ,数据 相对 于 时 钟 总 有 固定 的 关系 。 当 这 种 关系 满足 器 
件 的 建立 和 保持 时 间 的 要 求 时 ， 输 出 端 会 在 特定 的 传输 延迟 时 间 内 输出 一 
个 有 效 状 态 。 因 为 在 同步 系统 中 输入 信和 号 总 是 满足 触发 器 的 时 序 要求 ， 所 
以 不 会 发 生 亚 稳 态 。 但 是 ， 在 异步 系统 中 ， 由 于 数据 和 时 钟 的 关系 不 是 固 
定 的 ， 因 此 有 时 会 出 现 违 反 建立 和 保持 时 间 的 现象 。 当 违反 建立 和 保持 时 
间 时 ， 就 会 输出 介 于 两 个 有 效 状态 之 间 的 中 间 级 电 平 且 无 法 确定 停留 在 中 
间 状 态 的 时 间 ， 或 者 在 经 过 一 定 的 延迟 后 才能 进行 正常 转换 。 

本 章 将 帮助 读者 更 清楚 地 了 解 有 关 亚 稳 态 的 问题 ， 明 白 它 是 如 何 量化 
的 ， 以 及 如 何 最 大 限度 地 减少 它 的 危害 。 


1.2 亚 稳 态 理论 


亚 稳 态 是 由 于 违背 了 触发 器 的 建立 和 保持 时 间 而 产生 的 。 设 计 中 任何 
一 个 触发 器 都 有 特定 的 建立 和 保持 时 间 ， 在 时 钟 上 升 沿 前 后 的 这 段 时 间 窗 
口内 ， 数 据 输 入 信和 号 必须 保持 稳定 。 如 果 信 号 在 这 段 时 期 发 生 了 变化 ， 那 
么 输出 将 是 未 知 的 或 者 称 为 “ 亚 稳 的 ”。 这 种 有 害 状 态 的 传播 就 叫做 亚 稳 
态 。 触 发 器 的 输出 会 因此 而 产生 毛刺 ,或 者 暂时 保持 在 不 稳定 状态 而 且 需 
要 较 长 时 间 才 能 回 到 稳定 状态 。 


2 。 第 1 章 亚 稳 态 的 世界 


如 图 1.1 所 示 ， 当 触发 器 处 在 亚 稳 态 时 ， 输 出 会 在 高 低 电 平 之 间 波 
动 ， 这 会 导致 延迟 输出 转换 过 程 ， 并 超出 所 规定 的 时 钟 到 输出 的 延迟 值 
(iu) 。 亚 稳 态 输出 恢复 到 稳定 状态 所 需 的 超出 te 的 额外 时 间 部 分 称 为 稳定 
时 间 (tm) 。 并 非 所 有 不 满足 建立 和 保持 时 间 的 输入 变化 都 会 导致 亚 稳 态 
输出 。 触 发 器 是 否 进入 亚 稳 态 和 返回 稳 态 所 需 时 间 取决 于 生产 器 件 的 工艺 
技术 与 外 界 环 境 。 一 般 来 说 ， 触 发 器 都 会 在 一 个 或 者 两 个 时 钟 周期 内 返回 
稳 态 。 


| 时 钟 上 升 沿 
一 亚 稳 态 区 域 
-一 稳 态 区 域 





图 1.1 亚 稳 态 时 序 参数 


如 图 1.2 所 示 ， 触 发 器 的 运转 类 似 于 在 光滑 的 山上 滚动 球 ， 山 的 两 
边 代表 两 个 稳定 状态 〈 即 高 和 低 ) ， 山 顶 就 代表 亚 稳 态 。 假 设 球 处 在 一 
个 稳定 的 状态 〈 即 1 或 0)， 给 球 一 个 足够 (满足 建立 和 保持 时 间 要 求 ) 
的 推力 (状态 转换 ) ， 使 这 个 球 在 规定 时 间 内 越过 山顶 到 达 另 一 个 稳定 
的 状态 。 


亚 稳 态 





图 1.2 触发 器 的 亚 稳 态 行为 


然而 ， 如 果 推 力 不 够 〈 即 违反 建立 和 保持 时 间 ) ， 这 个 球 就 会 到 达 山 
项 ( 即 输出 亚 稳 态 ) ， 停 留 一 段 时 间 后 再 返回 到 一 个 稳定 的 状态 〈 即 最 终 


1.3 亚 稳 态 窗口 9 3 


输出 稳定 ) 。 这 个 球 也 可 能 会 上 升 一 段 路 程 就 返回 了 〈 即 输出 可 能 产生 毛 
刺 ) 。 这 两 种 情况 都 会 增加 从 时 钟 变 化 到 稳定 输出 的 延迟 。 

所 以 ， 简 单 地 说 ， 当 信和 号 在 一 个 时 钟 域 (src_data_out) 里 变化 ， 在 另 
一 个 时 钟 域 (dest_date_in) 内 采样 时 ， 就 会 导致 输出 变 成 亚 稳 态 。 这 就 是 
所 谓 的 同步 失败 ( 见 图 1.3)。 







dest_clk : 


dest data out : 


图 1.3 触发 器 中 的 亚 稳 态 


1.3 亚 稳 态 窗口 


亚 稳 态 窗口 (Metastability Window) 具有 特定 的 时 间 长 度 ， 在 这 段 时 
间 内 输入 信号 和 时 钟 都 应 该 保持 不 变 。 如 果 它 们 发 生变 化 ， 输 出 就 可 能 变 
成 亚 稳 态 。 如 图 1.4 所 示 ， 建 立时 间 和 保持 时 间 共 同 决定 亚 稳 态 窗口 的 
宽度 。 





图 1.4 ， 亚 稳 态 窗口 


窗口 越 大 ， 进 人 亚 稳 态 的 概率 越 高 。 在 大 多 数 情况 下 ， 较 新 的 逻辑 器 
件 会 有 更 小 的 亚 稳 态 窗口 ， 也 就 意味 着 器 件 进 入 亚 稳 态 的 概率 会 更 小 。 


4 3 第 1 章 亚 稳 态 的 世界 


1.4 


计算 MTBF 


当 系 统 的 故障 率 恒 定时 ，MTBEF (Mean/ Average Time Between Failures ， 
平均 无 故障 时 间 ) 就 是 故障 率 的 倒数 。 我 们 可 以 从 中 知道 特定 触发 器 发 生 
故障 的 频率 。 

对 于 一 个 具有 给 定时 钟 频率 和 在 该 时 钟 周 期 内 具有 均匀 概率 密度 的 异 
步 数 据 信 号 边沿 的 单 级 同步 器 ， 亚 稳 态 事件 的 发 生 率 可 以 用 建立 、 保 持 时 
间 窗 口 和 时 钟 周期 的 比值 乘 以 信号 触发 频率 来 计算 。 

i = MTBF, = ee CEI 
式 中 ,= 人 允许 超出 器 件 正常 传输 延迟 时 间 的 解析 时 间 
7= 触 发 器 的 亚 稳 态 (解析 ) 时 间 常 数 
下 = 亚 稳 态 窗 口 

人 = 时 钟 频率 

有 = 异步 信号 边沿 频率 

常数 下 和 7 跟 触发 器 的 电气 特性 有 关 ， 会 根据 工艺 技术 而 改变 。 所 
以 ， 相同 工艺 生产 出 来 的 不 同 器 件 有 着 相似 的 下 和 7 值 。 

如 果 在 不 同 的 解析 时 间 测 量 和 描绘 器 件 的 故障 率 ， 结 果 会 是 一 个 指数 
衰减 曲线 。 如 图 1.5 所 示 ， 当 以 半 对 数 刻 度 绘制 时 ， 结 果 就 是 一 条 斜率 为 
d 的 直线 ; 因此 ， 在 直线 上 取 两 个 数据 点 就 能 够 用 式 1. 2 计算 出 7 的 值 。 
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图 1.5 故障 率 和 时 间 的 关系 (对 数 刻度 ) 


to = ta Ci 2 
In( NI1/N2) 


1.5 避免 亚 稳 态 # 5 


式 中 tt = 解析 时 间 1 
ts = 解析 时 间 2 
N1 = 如 时 刻 的 故障 次 数 
N2 = 刀 时 刻 的 故障 次 数 
基于 式 1. 1 和 式 1. 2， 两 级 同步 器 的 MTBF 可 以 用 式 1.3 来 计算 。 
MTBE, = SH x elta/7) 人 
式 中 与 = 第 一 级 同步 器 的 解析 时 间 
ts = 超过 正常 传输 延迟 的 解析 时 间 
式 1.3 中 的 第 一 项 计算 出 了 第 一 级 同步 器 的 MTBF， 实 质 上 就 是 下 一 
级 的 亚 稳 态 发 生 率 。 第 二 项 则 根据 +:。( 解 析 时 间 ) 的 值 计算 出 了 亚 稳 态 事 
件 的 解析 概率 。 两 项 结果 的 乘积 就 是 两 级 同步 器 的 整个 MTBF。 
在 给 定 触发 器 时 钟 速率 和 输入 信号 变化 速率 的 情况 下 ， 如 果 MTBF 为 
40s， 根 据 式 1.3， 用 来 同步 输入 的 这 样 的 两 级 触发 器 的 MBTF 就 是 40 x 
40 =26. 6min。 





1.5 避免 亚 稳 态 


如 1.2 节 所 述 ， 每 当 违背 建立 、 保 持 时 间 时 ， 亚 稳 态 就 会 出 现 。 在 以 
下 条 件 中 ， 信 号 可 能 违背 时 序 要 求 。 

。 输入 信号 是 异步 信号 。 

。 时 钟 偏 移 / 摆 动 ( 上升/ 下降 时 间 ) 高 于 容 限 值 。 

。 信和 号 在 两 个 不 同 频率 或 者 相同 频率 但 是 相位 和 偏 移 不 同 的 时 钟 域 

下 跨 时 钟 域 工作 。 

。 组 合 延迟 使 触发 器 的 数据 输入 在 亚 稳 态 窗口 内 发 生变 化 。 

亚 稳 态 会 引起 过 多 的 传输 延迟 和 系统 故障 ， 所 有 的 触发 器 和 寄存 器 
都 存在 亚 稳 态 。 虽 然 亚 稳 态 不 能 根除 ， 但 是 可 以 减 小 亚 稳 态 发 生 的 
概率 。 

在 最 简单 的 情况 下 ， 设 计 人 员 可 以 通过 确保 时 钟 周期 足够 长 来 避免 
亚 稳 态 ， 这 个 时 钟 周 期 要 大 于 准 稳 态 的 解析 时 间 ， 也 要 大 于 通 往 下 一 级 
触发 器 的 路 径 上 的 任何 逻辑 延迟 。 虽 然 这 种 方法 简单 ， 但 在 大 多 数 现代 
设计 的 性 能 要 求 下 并 不 实用 。 另 一 种 避免 亚 稳 态 的 方法 就 是 使 用 同 
步 器 。 
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1.5.1 使 用 多 级 同步 器 


避免 亚 稳 态 最 常见 的 方法 是 在 跨 时 钟 域 的 信号 上 加 上 一 个 或 者 多 个 同 
步 触发 器 ， 如 图 1.6 所 示 。 这 种 方法 用 一 个 完整 的 时 钟 周期 来 解决 第 一 级 
同步 触发 器 的 亚 稳 态 问题 (不 包括 第 二 级 触发 器 的 建立 时 间 ) 。 但 是 这 种 
方式 增加 了 观察 同步 逻辑 输入 的 延迟 。 
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图 1.6 N 级 同步 器 


1.5.2 使 用 时 钟 售 频 电 路 的 多 级 同步 器 


多 级 同步 器 的 一 个 局 限 就 是 系统 需要 花费 较 长 的 时 间 去 响应 异步 输 
入 。 解 决 这 个 问题 的 办 法 就 是 使 用 倍 频 时 钟 作为 两 个 同步 触发 器 的 时 钟 输 
入 。Altera 的 FPGA 中 具有 这 项 称 为 时 钟 倍 频 的 技术 ( 见 图 1.7)。 


两 级 同步 器 






异步 输入 信号 






clk 2x 9 
(接收 器 时 钟 的 2 售 ) 


图 1.7 带 有 时 钟 倍 频 电路 的 多 级 同步 器 


这 种 方法 不 仅 能 够 让 系统 在 一 个 系统 时 钟 周期 内 响应 一 个 异步 输入 ， 
而 且 改 善 了 MTBF。 尽 管 这 种 倍 频 时 钟 能 够 降低 MTBF， 但 是 这 个 影响 要 超 
过 两 级 触发 器 引起 的 偏 移 量 。 

两 种 方法 都 不 能 保证 同步 器 阻止 亚 稳 态 传播 下 去 ， 它 们 仅仅 减少 了 亚 
稳 态 发 生 的 概率 。 


1.6 亚 稳 态 测试 电路 # 7 


1.6 亚 稳 态 测试 电路 


每 当 触发 器 采样 一 个 异步 输入 时 ， 触 发 器 输出 都 可 能 会 产生 一 个 不 可 
预测 的 延迟 ， 虽 然 这 个 概率 很 低 。 这 不 仅 会 在 输入 违反 建立 、 保 持 时 间 要 
求 时 发 生 ， 而 且 在 触发 器 接收 新 的 输入 这 一 小 段 时 序 窗口 内 也 会 发 生 。 在 
这 些 情 况 下 ， 触 发 器 都 会 进入 亚 稳 态 。 

图 1. 8 所 描述 的 测试 电路 可 以 用 来 确定 触发 器 的 亚 稳 态 特 征 。 图 1.8 
给 出 了 有 一 个 异步 输入 “async_in” 的 触发 器 “FF\”， 再 由 时 钟 “clk” 的 
上 升 沿 触发 。 图 1. 8 中 所 示 的 触发 器 “FF。” 和 “FF.” 都 在 时 钟 下降 沿 触 
发 ， 这 样 做 是 为 了 捕捉 FF, 的 亚 稳 态 事件 。 


asynce_In QA QBs 





图 1.8 亚 稳 态 测试 电路 


当 两 个 互补 的 信号 分 别传 递 到 “FF，” 和 “FF。” 的 输入 时 ，, 无论 
“FF, ”什么 时 候 出 现 亚 稳 态 事 件 ， 异 或 非 (XNOR) 门 的 输出 都 会 变 为 高 电 
平 。 在 触发 器 “FFv” 和 输出 端 捕捉 到 高 电 平 就 表明 已 经 检测 到 亚 稳 态 事件 。 

测试 电路 中 所 有 节点 的 时 序 如 图 1.9 所 示 。 

因为 解析 触发 器 (“FFs，” 和 “FF。”) 由 时 钟 下 降 沿 触发 ， 所 以 可 以 
通过 改变 时 钟 高 电 平 的 时 间 (Ai) 来 控制 所 要 求 的 稳定 时 间 。 稳 定时 间 
tau 由 下 式 确 定 

fr = At = tien (1.4) 

式 中 ，iscn 是 最 小 时 钟 周期 ,等 于 ic。( FF 的 时 钟 到 输出 延迟 ) + 解 
析 触 发 器 (FFs 或 FF.) 的 建立 时 间 i,。 

减少 解析 时 间或 者 稳定 时 间 的 方法 之 一 就 是 给 建立 /保持 时 间 处 的 数 
据 集 中 加 入 拌 动 。 
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由 于 异 或 非 门 置 高 ， 使 得 Qo 的 D 端 输 
入 置 高 (检测 到 亚 稳 态 ) 





图 1.9 测试 电路 中 的 时 序 


1.7 同步 器 的 类 型 


根据 式 1. 1， 一 个 异步 输入 电路 的 MTBF 和 用 于 从 亚 稳 态 恢复 的 时 间 
旦 指数 关系 。 用 同步 器 构成 的 时 间 缓 冲 器 可 以 帮助 从 亚 稳 态 中 恢复 。 

要 注意 ,一 个 异步 信号 不 应 该 被 两 个 或 者 多 个 同步 器 所 同步 (这 样 做 
会 存在 多 级 同步 器 输出 产生 不 同 信号 的 风险 ) 。 本 节 介 绍 两 级 同步 器 的 两 
种 不 同 的 模式 : 模式 A 和 模式 B。 

模式 A 是 一 个 标准 的 电路 ， 当 异步 输入 信号 比 时 钟 周期 大 得 多 时 最 有 
效 ( 见 图 1.10)。 

注意 ， 即 使 异步 输入 在 建立 时 间 区 间 之 外 稳定 ， 它 仍然 需要 由 时 钟 驱 
动产 生 两 个 周期 的 延迟 ， 否 则 FF1 可 能 进入 亚 稳 态 。 

如 果 亚 稳 态 在 不 到 一 个 时 钟 周期 内 就 解析 了 ，FF2 就 会 有 稳定 的 输入 ， 
否则 就 需要 更 深层 的 级 联 ， 如 图 1.6 所 示 。 

但 是 ,模式 A 不 能 用 于 异步 输入 信号 的 宽度 小 于 时 钟 周期 的 情况 。 在 
这 种 情况 下 要 采用 模式 B， 如 图 1. 11 所 示 。 
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同步 器 B 〈Tsyne napus< Tur) 





Sync_out 


async_In 


clk 








q2 
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sync_out | 


图 1.10 两 级 同步 器 的 模式 A 








图 1.11 两 级 同步 器 的 模式 B 


注意 ， 对 于 同步 器 的 模式 B， 第 一 级 触发 器 的 输入 D 与 Vec 相 连 ， 同 
时 时 钟 信号 是 异步 输入 信号 。 另 外 两 个 触发 器 直接 由 系统 时 钟 (clk) 控 
制 。 一 个 短 脉冲 让 ql 变 成 高 电 平 ， 这 个 高 电 平 在 经 过 两 个 时 钟 (clk) 党 
后 从 sync_out 输出 。 

我 们 总 结 了 如 下 经 验 规则 

1) 当 信号 必须 跨 时 钟 域 工作 时 ， 要 采用 同步 器 。 

2) 如 果 elkl < clk2 ， 在 时 钟 域 2 ( 见 图 1.11) 里 用 同步 器 的 模式 A， 
否则 就 采用 同步 器 的 模式 B。 
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1.8 亚 稳 态 /综合 性 建议 


在 两 个 相互 异步 系统 的 交界 面 亚 稳 态 是 不 可 避免 的 。 但 是 下 面 的 几 点 
建议 可 以 明显 减 小 亚 稳 态 发 生 的 概率 。 

(a) 采用 同步 器 。 

(b) 采用 响应 更 快 的 触发 器 〈 缩 短 亚 稳 态 窗 口 Tv ) 。 

(c) 使 用 亚 稳 态 硬 化 触发 器 〈 专 为 高 宽带 设计 并 且 减 少 为 时 钟 域 输入 
电路 而 优化 的 采样 时 间 ) 。 

(d) 如 图 1.6 所 示 ， 使 用 级 联 触发 器 (两 个 或 者 多 个 ) 作为 同步 器 。 
如 果 一 个 触发 器 的 亚 稳 态 失败 概率 为 P， 那 么 NN 个 触发 器 的 亚 稳 态 失败 率 
就 是 已 。 

(e) 减少 采样 速率 。 

(f) 避免 使 用 dV/di 低 的 输入 信号 。 


2 


概述 


第 2 章 


时 钟 和 复位 


目前 设计 专用 集成 电路 (ASIC) 的 成 本 每 年 都 在 增加 。 除 了 一 次 性 工 
程 (Non-Recuring Engineering，NRE) 成 本 和 掩 膜 成 本 ， 由 于 专用 集成 电 
路 的 复杂 程度 的 提高 ， 开 发 费用 也 有 所 增多 。 同 时 ， 由 于 ASIC 的 设计 复 
杂 性 使 得 改善 成 本 也 越 来 越 高 。 为 了 克服 重新 设计 的 风险 ， 高 NRE 成 本 和 
减少 上 市 时 间 的 延迟 ， 保 证 设计 的 芯片 能 在 第 一 次 流 片 后 就 可 以 工作 变 得 
越 来 越 重要 。 

本 章 涵盖 了 设计 者 在 设计 模块 或 者 知识 产权 (Intelletual Property, IP) 
时 所 要 用 到 的 一 些 建 议 。 这 些 建 议 独立 于 任何 CAD 工具 或 者 硅 工 艺 ， 并 能 
应 用 于 任何 ASIC 设计 ， 同 时 有 助 于 设计 者 用 结构 良好 的 和 可 综合 的 RTL 代 
码 来 计划 与 运行 一 个 成 功 的 片上 系统 (System on Chip，SoC)。 

当前 的 设计 逐渐 向 系统 级 集成 (System Level Integration，SLI) 转变 ， 
即将 多 个 复杂 功能 模块 和 多 种 存储 器 集成 在 单 块 电 路 上 ， 这 对 集成 水 平 提 
出 了 一 系列 新 的 要 求 。 这 些 建 议 主要 针对 模块 设计 和 和 集成 在 片上 系统 中 的 
存储 器 接口 。 然 而 ， 这 里 给 出 的 建议 跟 系统 级 集成 的 要 求 完全 一 致 ， 这 将 
会 极 大 地 减轻 集成 工作 ， 并 且 确 保 这 些 独立 模块 可 以 在 其 他 系统 里 轻松 地 
复 用 。 

可 以 以 这 些 建 议 为 基础 来 制 成 清单 ， 用 于 每 次 设计 制造 加 工 之 前 的 
检查 。 
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2.2 同步 设计 


在 同步 设计 中 ， 由 单个 主 时 钟 和 单个 主 置 位 /复位 信号 驱动 设计 中 所 
有 的 时 序 器 件 。 
经 验 表明 对 ASIC 的 时 域 控制 最 安全 的 方法 就 是 同步 设计 。 


2.2.1 避免 使 用 行 波 计数 器 


用 触发 器 来 驱动 其 他 触发 器 的 时 钟 输入 端 ， 一 般 会 存在 问题 。 由 于 第 
一 个 触发 器 时 钟 到 q 的 延迟 而 使 第 二 个 触发 器 的 时 钟 输入 产生 偏 移 ， 而 且 
不 能 在 每 个 时 钟 边沿 都 激活 。 用 这 种 方式 连接 两 个 以 上 的 触发 器 就 会 形成 
如 图 2. 1 所 示 的 行 波 计数 器 。 注 意 ， 由 于 使 用 了 更 多 的 触发 器 ， 会 使 延迟 
累积 增加 ， 所 以 不 推荐 使 用 这 种 方式 。 关 于 行 波 计数 器 的 更 多 细节 将 在 
5. 6.7 节 中 进行 介绍 。 





累积 延 时 


图 2.1 触发 器 驱动 其 他 触发 器 的 时 钟 输入 端 〈 行 波 计 数 器 ) 


2.2.2 门 控 时 钟 


时 钟 线 上 的 门 控 单 元 会 导致 时 钟 偏 移 ， 并 会 引入 尖峰 脉冲 作用 于 触发 
器 。 在 时 钟 线 上 存在 多 路 复 用 器 时 ， 这 个 问题 尤为 严重 ， 如 图 2. 2 所 示 。 


2 池 肌 同 条 设 儿 2 所 


ql 
D Q 
EN 
> CK 
CLK 


图 2.2 门 控 时 钟 线 
含 门 控 时 钟 的 设计 在 仿真 时 可 能 工作 很 正常 ， 但 是 进行 综合 时 就 会 出 
现 问题 。 
2.2.3 双边 沿 或 混合 边沿 时 钟 


如 图 2. 3 所 示 ， 两 个 触发 器 由 两 个 相位 相反 的 时 钟 信号 控制 。 这 会 为 
使 用 同步 复位 和 使 用 插入 扫描 链 这 样 的 测试 方法 带 来 麻烦 ， 同 时 也 会 增加 
确定 关键 信号 的 路 径 的 难度 。 





图 2.3 双边 沿 时 钟 


2.2.4 用 触发 器 驱动 另 一 个 触发 器 的 异步 复位 端 


在 图 2.4 中 ， 第 二 级 触发 器 的 输出 不 仅仅 只 受 时 钟 边沿 的 影响 ， 这 违 
反 了 同步 设计 原理 。 此 外 ， 该 电路 还 包含 第 二 级 触发 器 时 钟 和 复位 之 间 的 
潜在 竞争 条 件 。 

随后 的 章节 介绍 的 一 些 方法 可 以 避免 使 用 上 述 不 推荐 的 电路 。 
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图 2.4 触发 器 驱动 男 一 触发 器 的 异步 复位 端 


2. 3 推荐 的 设计 技术 


在 使 用 HDL 代码 进行 设计 时 ， 理 解 综合 工具 是 如 何 对 不 同 的 HDL 编 
码 风 格 和 结果 进行 解释 是 很 重要 的 。 从 硬件 角度 思考 作为 一 种 特别 的 设计 
风格 (或 相当 于 编码 风格 ) 很 重要 ， 这 会 影响 到 设计 门 数 和 时 序 性 能 。 本 
节 将 讨论 一 些 基 本 的 设计 技术 ， 以 得 确保 得 到 优化 的 设计 结果 ， 同 时 避免 
不 可 靠 和 不 稳定 。 


2. 3.1 避免 在 设计 中 出 现 组 合 环 路 


组 合 环 路 是 数字 设计 中 导致 不 稳定 和 不 可 靠 的 最 常见 因素 。 在 同步 设 
计 中 ， 所 有 反馈 回路 都 应 包含 寄存 器 。 组 合 环 路 建立 了 不 含 寄存 器 的 直接 
反馈 回路 ， 这 违背 了 同步 设计 原理 。 

在 HDL 语言 中 ， 当 信和 号 经 过 若干 组 合 always“ 块 产生 自身 时 ,或 者 算 
术 表 达 式 左边 的 内 容 也 出 现在 右边 时 ， 就 会 形成 组 合 环 路 。 组 合 环 路 对 设 
计 是 一 种 冒险 ， 在 遇见 组 合 环 路 时 综合 工具 总 是 会 报错 ， 它 是 不 可 综 
合 的 。 

组 合 环 路 的 产生 可 以 从 图 2. 5 的 气泡 图 中 理解 。 每 个 气泡 表示 一 个 组 
合 always 块 ， 进 入 其 中 的 箭头 表示 该 always 块 要 用 到 的 信号 ， 从 气泡 中 出 
去 的 箭头 表示 该 块 的 输出 信号 。 很 明显 信号 “a” 通 过 信号 “d” 依赖 于 自 
身 产生 ， 因 此 形成 了 组 合 环 路 。 





加 为 了 简单 起 见 ， 本 书 指 代 的 任何 HDL 语言 以 Verilog 为 例 。 
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图 2.5 组 合 环 路 的 例子 和 气泡 图 


代码 和 气泡 图 在 下 面 列 出 : 

为 了 移 除 组 合 环 路 ， 必 须 改变 其 中 一 个 信号 的 生成 方式 ， 以 消除 信和 号 
对 彼此 的 依赖 性 。 解 决 这 个 问题 的 简单 方法 是 在 组 合 环 路 中 引入 一 个 触发 
器 或 寄存 器 ， 以 将 直接 通路 打 断 。 

图 2. 6 展示 了 另 一 个 例子 ， 这 里 寄存 器 的 输出 通过 组 合 逻辑 直接 控制 
同一 个 寄存 器 的 异步 输入 端 。 





图 2.6 通过 异步 控制 端口 的 组 合 环 路 


组 合 环 路 是 固有 的 高 风险 设计 结构 。 组 合 环 路 的 行为 与 该 环 路 中 所 有 
逻辑 的 传播 延迟 相关 。 因 为 传播 延迟 会 根据 不 同 条 件 而 改变 ， 所 以 组 合 环 
路 的 行为 也 可 能 变化 。 在 许多 设计 工具 中 ， 组 合 环 路 都 会 导致 无 休止 的 循 
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环 运算 。 在 设计 流程 中 使 用 到 的 各 种 工具 可 能 会 以 不 同 的 方式 将 组 合 环 路 
打 断 ， 以 与 原始 设计 意图 不 一 致 的 方式 对 其 进行 处 理 。 


2. 3.2 避免 数字 设计 中 的 延迟 链 


在 用 两 个 或 多 个 带 有 单 扇 人 和 单 扇 出 的 连续 节点 产生 延迟 时 ， 就 会 形 
成 延迟 链 。 通 常 将 反 向 器 链 在 一 起 以 增加 延迟 。 延 迟 链 通常 出 现在 异步 设 
计 中 ， 有 时 用 来 解决 由 其 他 组 合 逻 辑 导 致 的 竞争 条 件 。 在 FPGA 和 ASIC 
中 ， 都 会 因为 布局 布线 产生 延迟 。 延 迟 链 能 导致 各 种 各 样 的 设计 问题 ， 包 
括 增加 设计 对 操作 环境 的 敏感 性 ， 降 低 设计 的 可 靠 度 ， 以 及 增加 将 设计 移 
植 到 不 同 器 件 结构 上 的 难度 。 避 免 使 用 延 时 链 ， 需 要 在 设计 中 用 同步 技术 
取代 异步 技术 。 


2. 3.3 避免 使 用 异步 脉冲 产生 器 


设计 通常 要 求 基于 某 些 事件 产生 脉冲 。 设 计 人 员 有 时 会 使 用 延迟 链 产 
生 单个 脉冲 〈 脉 冲 产生 器 ) 或 一 系列 脉冲 〈 多 振子 ) 。 有 两 种 常用 方法 产 
生 脉 冲 。 这 些 技术 是 纯 异 步 的 ， 应 尽 可 能 避免 使 用 。 
。 将 同一 个 触发 信号 接 到 两 输入 与 门 或 或 门 的 两 个 输入 端 ， 但 是 对 
其 中 一 个 输入 端的 信号 取 反 或 加 入 延迟 链 。 脉 冲 的 宽度 取决 于 直 
接 接 到 门 输入 端的 信号 和 经 过 延迟 后 接 到 门 输入 端的 信号 的 相对 
延迟 。 这 与 组 合 逻 辑 中 由 输入 端 变化 引起 毛刺 的 原理 是 一 样 的 。 
这 种 技术 通过 使 用 延迟 链 人 为 地 增加 了 毛刺 宽度 。 
。 寄存 器 输出 经 过 延迟 链 后 驱动 同一 个 寄存 器 的 异步 复位 端 。 该 寄 
存 器 本 质 上 经 过 一 个 确定 的 延迟 后 对 自身 异步 复位 。 
异步 产生 的 脉冲 宽度 常常 为 综合 和 布局 布线 软件 带 来 难题 。 实 际 的 脉 
冲 宽度 只 有 在 布局 布线 之 后 ， 在 布线 和 传播 延 时 已 知 时 才能 确定 。 所 以 很 
难 在 创建 HDL 时 就 确定 可 靠 的 延迟 值 。 脉 冲 宽度 可 能 不 适用 于 所 有 PVT 
环境 ,并 且 转 移 到 不 同 技术 节点 时 脉冲 宽度 也 会 变化 。 除 此 之 外 ， 因 为 静 
态 时 序 分 析 不 能 用 来 验证 脉冲 宽度 ， 所 以 验证 工作 会 变 得 困难 。 
多 振子 利用 “毛刺 产生 器 ”的 原理 创建 脉冲 ， 此 外 组 合 环 路 将 该 电路 
转变 为 振荡 器 1。 
因为 涉及 对 脉冲 数量 的 控制 ， 所 以 产生 多 脉冲 的 结构 会 比 脉 冲 产 生 器 引 
起 更 多 的 问题 。 此 外 在 使 用 该 结构 产生 多 脉冲 时 ， 也 增加 了 设计 的 频率 。 
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推荐 使 用 的 同步 脉冲 产生 器 如 图 2.7 所 示 。 

















图 2.7 触发 器 输入 起 始 处 的 同步 脉冲 产生 器 


在 上 面 的 同步 脉冲 产生 器 中 ， 脉 冲 宽 度 总 是 与 时 钟 周 期 宽度 相等 。 
该 脉冲 产生 器 是 可 预测 的 ， 可 以 用 时 序 分 析 进 行 验证 ， 并 易于 移植 到 其 
他 体系 结构 中 ， 同 时 独立 于 具体 的 工艺 。 

与 图 2.7 类 似 ， 图 2. 8 是 在 触发 输入 末端 产生 脉冲 的 脉冲 产生 器 。 


2. 3.4 避免 使 用 锁 存 器 


在 数字 设计 中 ， 锁 存 器 用 来 在 新 的 值 到 来 前 保持 原来 信号 的 值 。 避 免 
在 所 有 可 能 的 位 置 使 用 锁 存 器 ， 而 应 用 触发 器 代替 。 

如 图 2. 9 所 示 ， 如 果 X 和 了 信号 都 变 为 高 ， 因 为 锁 存 器 由 电 平 触发 ， 
所 以 将 它们 同时 开启 会 使 电路 产生 振荡 。 

锁 存 器 会 为 设计 增加 各 种 各 样 的 问题 。 虽 然 锁 存 器 是 与 寄存 器 相似 的 
存储 器 件 ， 但 是 它们 有 根本 的 区 别 。 锁 存 器 是 连通 模式 的 ， 即 在 数据 输入 
和 输出 之 间 存 在 直接 通路 。 输 入 端的 毛刺 能 传递 到 输出 端 。 
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图 2.9 锁 存 器 的 竞争 条 件 


静态 时 序 分 析 器 通常 会 作出 与 锁 存 器 透明 有 关 的 错误 假设 ， 并 要 么 发 
现 通 过 数据 输入 端口 的 伪 路 径 要 么 将 真正 的 关键 路 径 丢 失 。 锁 存 器 本 身 的 
时 序 也 是 模糊 的 。 例 如 ， 在 分 析 含 D 锁 存 器 的 电路 时 ， 工 具 无 法 确定 你 是 
想 在 时 钟 前 沿 还 是 在 时 钟 后 沿 将 数据 传输 到 输出 端 。 大 多 数 情 况 下 ， 只 有 
原始 设计 者 才 知 道 设计 的 全 部 意图 ， 这 也 就 意味 着 其 他 设计 者 很 难 移植 同 
样 的 设计 或 复 用 代码 。 

锁 存 器 常常 使 电路 不 可 测 。 大 多 数 可 测 性 设计 (Design For Test， 
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DFT) 工具 和 自动 测试 程序 生成 器 (Automatic Test Program Generator，AT- 
PG) 都 不 能 很 好 地 处 理 锁 存 器 。 

锁 存 器 给 FPGA 设计 带 来 了 不 同 的 挑战 ， 因 为 FPCA 是 寄存 器 密集 型 
的 ; 所 以 使 用 锁 存 器 的 设计 会 占用 更 多 逻辑 ， 并 且 比 使 用 寄存 器 的 设计 性 
能 更 低 。 

综合 工具 有 时 会 推断 出 设计 意图 之 外 的 锁 存 器 。 这 样 的 锁 存 器 往往 源 
自 不 完整 的 “if” 或 “else” 语 句 。 忽 略 “if” 或 “case” 表 达 中 最 终 的 
“else” 分 句 也 会 形成 锁 存 器 。 图 2. 10 给 出 了 一 个 类 似 的 例子 。 





always @ (clk) 
begin 
TE tol) 
begin 





UE 
b= 150 
end 
else 
yo 2 ds 








end 














图 2.10 由 不 完整 的 “if else” 描 述 推 断 的 锁 存 器 


如 图 2. 10 所 示 ， 把 “b” 综 合成 直 连 的 组 合 逻辑 ，“a” 将 推断 为 锁 
存 器 。 

推断 锁 存 器 的 一 般 规则 是 ， 如 果 一 个 变量 未 能 在 always 语句 的 所 有 可 
能 执行 条 件 下 赋值 (例如 ， 当 一 个 变量 没有 在 让 语句 的 所 有 分 支 中 赋值 
时 ) ， 就 会 形成 锁 存 器 。 

某 些 FPCA 架构 不 支持 锁 存 器 。 当 综合 包含 锁 存 器 的 设计 时 ， 综 合 工 
具 会 创建 组 合 反馈 通路 来 取代 锁 存 器 〈 如 图 2. 11 所 示 ) 。 











时 钟 





图 2.11 由 不 完整 的 “if else” 描 述 实现 的 组 合 环 路 
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虽然 图 2. 11 中 的 组 合 反 馈 通 路 有 锁 存 数据 的 能 力 ， 但 是 造成 了 比 锁 
存 器 更 多 的 问题 ， 因 为 这 种 电路 结构 可 能 违背 建立 时 间 和 保持 时 间 的 要 
求 ， 而 且 很 难 发 现 ， 相 比 之 下 ， 由 于 锁 存 器 由 电 平 触发 ， 因 此 并 没有 建立 
时 间 和 保持 时 间 的 问题 。 


加 注意 
设计 中 不 应 包含 任何 组 合 反馈 环 路 。 应 该 用 触发 器 、 锁 存 器 或 完整 的 
RTL 枚 举 条 件 来 取代 它 。 


总 而 言 之 ， 这 并 不 意味 着 锁 存 器 永远 不 能 存在 ， 我 们 将 在 后 面 看 到 使 
用 锁 存 器 挪用 周期 或 借用 时 间 来 满足 关键 路 径 的 要 求 ， 这 是 一 件 多 么 有 趣 
的 事 。 


2. 3.5 避免 使 用 双 沿 时 钟 


使 用 双 沿 时 钟 是 指 在 时 钟 的 上 升 沿 和 下 降 沿 都 传输 数据 。 这 种 改变 使 
得 数据 传输 在 给 定 的 时 钟 速率 下 能 达到 双 倍 的 吞吐 率 。 

双 沿 输出 级 时 钟 是 一 种 增加 设计 最 大 可 能 输出 速度 的 有 效 方法 ,但 是 
它 违反 了 同步 电路 的 原理 并 将 导致 一 系列 问题 。 

图 2. 12 给 出 了 一 个 由 双 沿 时 钟 触发 的 电路 。 





2. 12 ”由 双边 沿 时 钟 驱动 的 逻辑 


使 用 双 沿 时 钟 时 遇 到 的 一 些 问题 如 下 : 

。 不 对 称 的 时 钟 占 空 比 会 导致 违背 建立 和 保持 时 间 。 

。 很 难 确定 关键 信号 的 路 径 。 

。 很 难 使 用 像 插入 扫描 链 这 样 的 设计 方法 学 ， 因 为 它 要 求 所 有 寄存 
器 使 用 同样 的 时 钟 边沿 。 如 果 要 在 双 沿 电路 中 插入 扫描 链 ， 那 么 
必须 在 时 钟 线 上 插入 多 路 复 用 器 以 保证 在 测试 模式 下 使 用 单一 
时 钟 。 
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图 2. 13 中 是 一 种 使 用 单个 时 钟 的 通常 等 效 流水 线 逻 辑 。 注 意 ， 该 同 
步 电 路 要 求 的 时 钟 频率 是 图 2. 12 的 两 倍 。 





图 2.13 使 用 单 沿 时 钟 的 逻辑 


图 2. 14 展示 了 由 时 钟 驱动 的 单 沿 数据 传输 和 多 沿 数据 传输 过 程 。 





时 钟 
I i i 1 il ! i i 





数据 ( 单 沿 ) 
1 ! ! ! ! 1 


! | 
数据 (RN XOCOOCOCOOCOOOFC 
| 


2.14 单 / 双 沿 数据 传输 


绿色 和 蓝 色 信和 号 表示 数据 ; 六 边 形 形 状 是 表示 信号 的 惯用 方式 ， 在 任 
何 给 定时 刻 信号 值 可 能 是 1 或 0。 

在 图 2. 12 中 ， 时 钟 非 对称 占 空 比 可 能 导致 违背 建立 和 保持 时 间 ， 而 
且 扫 描 路 径 也 不 能 很 容易 地 通过 触发 器 。 

这 并 不 意味 着 永远 不 能 使 用 双 沿 时 钟 。 在 对 性 能 /速度 要 求 很 高 的 情 
况 下 ， 并 且 无 法 承受 使 用 等 效 同步 电路 在 DFT 和 验证 方面 所 带 来 的 额外 开 
支 时 ， 也 可 以 使 用 双 沿 时 钟 。 


双 沿 时 钟 的 优点 


PC 世界 中 永恒 不 变 的 信条 是 提升 性 能 。 这 也 就 意味 着 大 多 数 接口 在 
不 断 地 改进 ， 以 使 用 更 高 的 时 钟 来 提高 吞吐 率 。PC 世界 中 的 许多 较 新 技 
术 已 经 超越 了 单一 提高 时 钟 频率 的 方式 。 它 们 改变 了 接口 或 总 线 传输 信号 
的 整体 方式 ， 使 数据 在 每 个 时 钟 周 期 内 不 止 传输 一 次 ， 而 是 两 次 或 更 多 。 
使 用 双 沿 时 钟 比 使 用 两 倍 时 钟 频 率 的 等 效 同步 电路 有 其 他 的 好 处 。 无 
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论 程 度 如 何 ， 接 口 设计 人 员 通 常 都 会 提高 系统 的 时 钟 频率 。 然 而 ， 过 高 的 
时 钟 频率 会 给 许多 接口 带 来 问题 。 最 常见 的 问题 就 是 接口 本 身 的 电气 特 
性 。 随 着 时 钟 频率 和 时 序 的 增加 干扰 会 变 得 越 来 越 敏 感 ， 使 得 接口 电路 必 
须 制 作 得 更 精细 以 处 理 更 高 的 时 钟 频率 ， 这 就 增加 了 成 本 。 

另外 一 个 使 用 双 沿 时 钟 的 优势 是 降低 功 耗 ， 因 为 时 钟 频率 减 半 ， 所 以 
系统 的 功 耗 只 有 等 效 同步 电路 的 一 半 。 

总 之 ， 除 非 等 效 同步 电路 无 法 满足 所 期 望 的 性 能 时 ， 系 统 设计 人 员 才 
应 该 使 用 双 沿 时 钟 。 


2.4 ”时 钟 方案 


2.4. 1 内 部 产生 的 时 钟 


设计 者 应 该 尽 可 能 避免 在 内 部 产生 时 钟 ， 因 为 如 果 操 作 不 当 ， 它 会 导 
致 设计 功能 和 时 序 问题 。 

组 合 逻 辑 搭建 的 时 钟 产 生 器 会 引入 毛刺 ， 使 功能 出 现 问题 ， 此 外 由 组 
合 逻辑 所 导致 的 延迟 也 会 导致 时 序 方 面 的 问题 。 在 同步 设计 中 ， 数 据 输 入 
端的 毛刺 不 会 引起 任何 问题 ， 因 为 数据 是 在 时 钟 边 沿 处 捕获 的 ， 所 以 可 以 
将 毛刺 自动 滤 掉 。 然 而 ， 如 果 毛 刺 或 尖峰 脉冲 出 现在 时 钟 输入 端 〈 或 者 寄 
存 器 的 异步 输入 端 ) 就 会 产生 明显 的 影响 。 

罕 毛 刺 会 违背 寄存 器 的 最 小 脉冲 宽度 要 求 。 在 毛刺 到 达 时 钟 输入 端 
时 ， 如 果 寄 存 器 的 数据 输入 变化 ， 会 违背 建立 和 保持 时 间 。 即 使 设计 没有 
违背 时 序 要 求 ， 寄 存 器 也 可 能 输出 意料 之 外 的 值 ， 使 整个 设计 功能 出 现 风 
险 ， 这 可 能 在 设计 中 的 任何 位 置 出 现 。 

图 2. 15 展示 了 使 用 组 合 逻 辑 在 同步 计数 器 上 产生 时 钟 的 效果 。 在 时 
序 图 中 可 以 看 到 ， 由 于 时 钟 沿 处 的 毛刺 ， 计 数 器 在 所 示 的 时 钟 周期 上 递增 
了 两 次 。 

由 于 时 钟 毛 刺 的 作用 ， 计 数 器 增加 了 额外 的 计数 值 ， 这 样 就 可 能 导致 
功能 出 现 问题 。 


网 注意 
这 时 为 了 方便 起 见 ， 假 设计 数 器 在 毛刺 处 的 数据 没有 违背 建立 和 保持 
时 间 方 面 的 要 求 。 
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图 2.15 使 用 组 合 逻辑 作为 时 钟 的 计数 器 例子 


解决 上 述 问题 的 一 个 简单 方法 是 在 组 合 逻 辑 的 输出 端 增 加 一 个 寄存 
器 ， 用 寄存 器 的 输出 作为 后 面 的 时 钟 信号 。 这 个 寄存 器 可 以 保证 在 寄存 器 
的 数据 输入 端 阻止 组 合 逻 辑 所 产生 的 毛刺 ( 见 图 2. 16) 。 





Kx 
图 2.16 推荐 的 时 钟 产生 技术 


用 来 产生 内 部 时 钟 的 组 合 逻辑 也 会 增加 时 钟 线 上 的 延迟 。 在 某 些 情况 
下 ， 时 钟 线 上 的 逻辑 延迟 会 导致 时 钟 偏 移 比 两 个 寄存 器 之 间 的 数据 路 径 延 
迟 更 大 。 如 果 时 钟 偏 移 大 于 数据 延迟 ， 就 会 违背 寄存 器 的 时 序 要 求 ， 设 计 
的 功能 也 不 会 正确 。 
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图 2. 17 给 出 了 一 个 由 时 钟 路 径 延 迟 导致 在 输入 “IN” 端 违背 建立 时 
间 的 例子 。 





时 钟 产生 逻辑 


内 部 产生 的 时 钟 


< 一 dy 一 


违背 触发 器 的 建立 时 间 dy。 
ee ee 
| 


1 
CLR | 





图 2.17 由 于 时 钟 路 径 偏 移 导致 违背 建立 时 间 


国 ) 注意 
为 简单 起 见 ， 数 据 通路 延迟 假设 为 0。 


一 种 减少 时 钟 偏 移 的 方法 是 将 产生 的 时 钟 放 到 SoC 中 高 扇 出 且 低 偏 
移 值 的 时 钟 树 上 。 使 用 低 偏 移 值 时 钟 树 有 助 于 减少 信号 整体 的 时 钟 
偏 移 。 


2. 4.2 分 频 时 钟 


许多 设计 需要 来 自 于 主 时 钟 的 分 频 时 钟 。 在 设计 中 要 保证 大 多 数 时 钟 
来 自 于 PLL。 使 用 PLL 能 避免 由 异步 时 钟 分 频 逻 辑 引 起 的 许多 问题 。 在 对 
主 时 钟 进行 分 频 时 ， 应 该 始终 使 用 同步 计数 器 或 状态 机 。 

此 外 ,设计 应 该 保证 总 是 由 寄存 器 直接 产生 分 频 时 钟 信和 号。 永远 不 要 
对 计数 器 或 状态 机 的 输出 进行 解码 ， 然 后 产生 时 钟 信号 ; 这 种 实现 方式 常 
常会 导致 毛刺 和 尖峰 脉冲 。 
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2.4.3 人 行 波 计数 器 


ASIC 设计 人 员 常 常 使 用 行 波 计数 器 对 时 钟 进行 寡 为 2 的 分 频 ， 与 其 他 
同步 计数 方式 相 比 ， 行 波 计数 器 使 用 的 门 数 更 少 。 行 波 计数 器 使 用 级 联 寄 
存 器 ， 即 每 个 寄存 器 的 输出 引 脚 连接 到 下 一 级 寄存 器 的 时 钟 引 脚 上 ( 见 
图 2.18) 。 





2.18 行 波 计 数 器 的 级 联 效应 


因为 计数 器 在 各 阶段 创建 行 波 时 钟 ， 所 以 这 种 级 联 会 导致 问题 。 这 些 
行 波 时 钟 会 对 STA 和 综合 工具 带 来 麻烦 。 所 以 应 该 尝试 避免 使 用 这 种 结构 
以 减少 验证 的 工作 量 。 

尽管 使 用 行 波 计数 器 存在 各 种 挑战 和 问题 ， 但 是 在 功 耗 较 高 的 系统 中 
很 适合 使 用 这 种 计数 器 ， 因 为 这 样 能 大 量 降低 由 逻辑 或 SoC 所 引起 的 峰值 
功 耗 。 

[全 | 注意 
在 少数 的 情况 下 数字 设计 师 可 以 考虑 使 用 这 种 技术 ， 但 需 严 格 控制 。 


参考 第 5 章 以 理解 使 用 行 波 计 数 器 来 节省 功 耗 的 更 多 细节 。 


2.4.4 多 路 时 钟 


时 钟 多 路 器 用 于 使 同一 个 逻辑 功能 具有 不 同 的 时 钟 。 某 些 类 型 的 多 路 
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逻辑 选择 图 2. 19 中 所 示 的 时 钟 源 。 


多 路 复 用 时 钟 





多 路 复 用 逻辑 





图 2. 19 多 路 逻辑 和 时 钟 源 


例如 ， 需 要 处 理 多 个 频率 标准 的 通信 应 用 常常 使 用 多 个 时 钟 。 

虽然 在 时 钟 信号 上 引入 多 路 逻辑 会 引入 前 面 章节 中 所 提 及 的 问题 , 但 
是 在 不 同 的 应 用 中 对 多 路 时 钟 的 要 求 差 别 很 大 。 

如 果 能 满足 下 面 的 标准 ， 时 钟 多 路 操作 就 是 可 接受 的 : 

。 在 初始 化 配置 后 ， 时 钟 多 路 逻辑 就 不 再 改变 。 

。 在 测试 时 ,设计 会 绕 过 功能 时 钟 多 路 逻辑 而 选择 普通 时 钟 。 

。 在 时 钟 切换 时 ， 寄 存 器 始终 处 于 复位 状态 。 

。 在 时 钟 切换 时 产生 的 短暂 错误 响应 没有 负面 影响 。 

如 果 设 计 中 时 钟 切换 很 频繁 ， 并 且 不 在 复位 时 切换 ， 设 计 也 不 能 容忍 
芯片 中 出 现 短暂 的 错误 响应 ， 就 必须 使 用 同步 设计 以 确保 寄存 器 没有 违背 
时 序 ， 时 钟 信号 上 不 出 现 毛刺 同时 没有 竞争 条 件 或 其 他 麻烦 。 


2.4.5 同步 时 钟 使 能 和 门 控 时 钟 


门 控 时 钟 使 用 使 能 信号 开关 时 钟 ， 实 现 对 某 些 门 控 电 路 的 控制 。 如 
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图 2. 20 所 示 ， 在 时 钟 关闭 时 ， 相 应 的 时 钟 域 就 会 关闭 ， 其 功能 会 无 效 。 





图 2.20 门 控 时 钟 


门 控 时 钟 是 减少 功 耗 的 有 力 手段 。 在 时 钟 被 门 控 关 闭 后 ， 该 时 钟 
网 络 和 其 中 的 寄存 器 都 会 停止 翻转 ， 因 此 它们 的 功 耗 减少 。 然 而 ， 由 
于 门 控 时 钟 并 不 是 同步 设计 方案 的 一 部 分 ， 因 此 会 显著 增加 设计 时 间 
和 验证 的 工作 量 。 门 控 时 钟 会 增加 时 钟 偏 移 并 对 毛刺 敏感 ， 所 以 能 导 
致 设计 失败 。 

通过 使 用 同步 的 时 钟 使 能 ， 可 以 纯 同 步 方 式 关闭 时 钟 域 。 然 而 ， 在 使 
用 同步 时 钟 使 能 方案 时 ， 时 钟 树 一 直 保持 翻转 而 且 每 个 触发 器 的 内 部 电路 
保持 活跃 〈 虽 然 触发 器 输出 值 没有 改变 ) ， 这 样 无 法 降低 功 耗 。 同 步 时 钟 


使 能 技术 如 图 2. 21 所 示 。 
| 
> 


使 能 


图 2.21 同步 时 钟 使 能 


由 于 时 钟 网 络 仍然 在 不 停 翻转 ， 因 此 同步 时 钟 使 能 的 时 钟 方案 不 能 像 
门 控 时 钟 那样 从 源头 减少 功 耗 ， 但 是 通过 使 某 些 寄存 器 失效 ， 可 以 实现 与 
门 控 时 钟 同样 的 功能 。 如 图 2. 21 所 示 ， 根 据 使 能 信号 ， 每 个 触发 器 数据 
输入 端 前 面 的 多 路 器 要 么 载 人 新 的 数据 ， 要 么 复制 寄存 器 的 输出 。 

下 一 节 将 会 重点 介绍 高 效 门 控 时 钟 方法 学 ， 以 在 对 功 耗 要 求 严格 的 设 
计 中 使 用 。 
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2.5 门 控 时 钟 方法 学 


在 传统 的 同步 设计 风格 中 ， 系 统 时 钟 连接 到 每 个 寄存 器 的 时 钟 端 。 这 
使 得 功 耗 主要 由 三 个 部 分 组 成 。 

1) 在 每 个 时 钟 沿 变化 的 组 合 逻 辑 所 产生 的 功 耗 〈 由 于 触发 器 驱动 这 
些 组 合 逻 辑 ) 。 

2) 由 触发 器 产生 的 功 耗 (即使 在 触发 器 的 输入 和 内 部 状态 未 变化 ， 
该 功 耗 仍然 存在 ) 。 

3) 设计 中 时 钟 树 产生 的 功 耗 。 

对 时 钟 路 径 进 行 门 控 能 大 幅 降 低 触 发 器 的 功 耗 。 门 控 时 钟 可 以 存在 于 
时 钟 树 的 根部 、 末 端 ， 或 两 者 之 间 的 任何 位 置 。 

由 于 时 钟 树 几乎 消耗 了 整个 芯片 功 耗 的 50% ， 因 此 最 好 始终 在 根部 产 
生 或 关闭 时 钟 ， 以 使 整个 时 钟 树 都 关闭 ， 而 不 是 沿 时 钟 树 在 末端 才 关 闭 
时 钟 。 

图 2. 22 是 一 个 带 门 控 时 钟 的 三 位 计数 器 。 

除了 把 门 控 时 钟 器 件 插入 时 钟 网 络 中 ， 该 电路 与 传统 的 实现 方式 是 相 
同 的 ， 这 样 只 有 在 INC 输入 为 高 电 平时 才 由 时 钟 驱 动 触发 器 。 当 INC 输入 
为 低 电 平时 ， 触 发 器 无 时 钟 输入 ， 因 此 保持 原来 的 值 。 这 样 就 节省 了 触发 
器 前 面 的 3 个 多 路 器 ， 这 3 个 多 路 器 按 图 2. 21 所 示 的 方式 在 由 同步 时 钟 使 
能 实现 门 控 时 插入 。 当 实现 大 的 寄存 器 块 时 ， 这 会 节省 大 量 的 面积 。 


2.5. 1 不 含 锁 存 器 的 门 控 时 钟 电 路 


不 含 锁 存 器 的 门 控 时 钟 使 用 一 个 简单 的 “与 ” 门 或 “或 ” 门 实现 
(取决 于 触发 器 使 用 哪个 边沿 ) ， 如 图 2. 23 所 示 。 

为 了 避免 过 早 截断 时 钟 脉冲 或 误 产 生 多 个 时 钟 脉冲 (或 时 钟 上 的 毛 
刺 ) ， 正 确 的 操作 强制 要 求 使 能 信号 从 时 钟 活 牙 沿 (上 升 沿 ) 起 到 时 钟 不 
活跃 沿 (下 降 沿 ) 止 一 直 保持 常量 。 

图 2. 24 说 明了 未 满足 上 述 要 求 而 使 产生 的 时 钟 过 早 被 截断 的 情况 。 

这 种 限制 使 得 在 基于 单 时 钟 触发 器 的 设计 中 不 适合 使 用 不 含 锁 存 器 的 
门 控 时 钟 。 
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COUNT[0] 


COUNTI1] 





图 2.22 含 时 钟 门 控 的 三 位 计数 器 


EN 
GATED CLK 
CLK 


CLK | | | | | | 
< 一 一 一 > 稳定 区 域 


EN | 
GATED CLK | | 


图 2.23 ”不 含 锁 存 器 的 时 钟 门 控 电 路 
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在 下 降 沿 之 前 撤销 使 能 


稳定 区 域 


本 截断 时 钟 的 高 电 平 周 期 


i ¥ 
GATED CLK | 


\ 
一 


图 2.24 生成 时 钟 过 早 地 终止 


2.5.2 基于 锁 存 器 的 门 控 时 钟 电路 


基于 锁 存 器 的 门 控 时 钟 风格 向 设计 中 加 入 了 一 个 电 平 敏感 的 锁 存 器 ， 
以 在 时 钟 活跃 沿 和 不 活跃 沿 之 间 保 持 使 能 信号 不 变 ， 这样 就 无 须 依靠 门 控 
电路 本 身 来 满足 这 一 要 求 了 ， 如 图 2. 25 所 示 。 






GATED CLK 


CLK 


GATED CLK 


图 2.25 基于 锁 存 器 的 时 钟 门 控 电路 
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由 于 锁 存 器 能 捕捉 到 使 能 信号 并 使 它 保持 到 产生 完整 的 时 钟 脉 冲 ， 因 
此 使 能 信号 只 需要 在 时 钟 上 升 沿 附近 保持 稳定 即 可 。 

使 用 这 种 技术 ， 每 次 只 需要 改变 门 的 一 个 输入 端 来 打开 或 关闭 时 钟 ， 
就 能 保证 电路 的 输出 不 含 任何 毛刺 或 尖峰 脉冲 了 。 
[ 葬 ] 注意 

使 用 与 门 控制 在 上 升 没 有 效 的 时 钟 。 对 于 在 下 降 沿 有 效 的 时 钟 ， 使 用 
或 门 进行 控制 ， 并 用 正 沿 触发 的 锁 存 器 寄存 使 能 信号 。 


在 使 用 这 一 技术 时 ， 必 须 特 别 注意 时 钟 的 占 空 比 以 及 产生 使 能 信和 号 

逻辑 的 延迟 ， 因 为 使 能 信号 必须 在 半 时 钟 周期 时 产生 。 在 产生 使 能 信和 号 
的 逻辑 极为 复杂 或 者 时 钟 占 空 比 失衡 时 ， 就 会 产生 问题 。 与 其 他 产生 门 
控 时 钟 的 方式 引入 的 问题 相 比 ， 关 注 占 空 比 和 逮 辑 延迟 的 工作 量 是 可 以 
接受 的 。 
为 了 保证 较 高 的 生产 缺陷 覆盖 率 ， 有 必要 保证 在 使 用 扫描 方法 学 时 门 
控 时 钟 电路 是 完全 可 控 和 可 观察 的 。 加 入 控制 信号 ， 使 得 设计 中 所 有 触发 
器 不 管 使 能 值 是 多 少 都 能 被 时 钟 驱 动 ， 这 样 就 能 使 扫描 链 按 正常 方式 移动 
扫描 数据 了 。 

该 信号 可 以 在 锁 存 器 前 先 与 使 能 信号 进行 一 次 或 操作 ， 并 可 将 该 信和 号 
连接 到 指示 进入 扫描 测试 中 的 测试 模式 信号 上 ， 或 连接 到 只 在 扫描 移 位 时 
有 效 的 扫描 使 能 信号 上 。 

修改 后 的 电路 如 图 2. 26 所 示 。 大 多 数 ASIC 生产 商都 提供 “ 门 控 时 钟 
单元 ”作为 标准 单元 库 的 一 部 分 。 


ER 


GATED CLK 





图 2.26 标准 时 钟 门 控 单 元 
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2:5.3” 门 控 信 号 


对 设计 的 特殊 部 分 使 用 门 控 信号 能 提高 能 效 。 与 门 控 时 钟 的 概念 相 
似 ， 门 控 信 号 减少 了 与 时 钟 无 关 信 号 的 变化 。 最 常见 的 例子 是 解码 器 
使 能 。 

在 地 址 解码 机 制 中 ， 地 址 信号 会 在 所 有 目标 模块 解码 器 中 变化 。 解 码 
器 输入 端的 切换 行为 会 导致 大 量 的 门 翻转 。 可 以 用 使 能 或 选择 信号 阻止 切 
换行 为 的 传播 ， 但 是 可 能 会 使 逻辑 变 成 稍为 复杂 〈 见 图 2.27) 。 


INO IN0 
IN1 OUT0 IN1 OUTO 
OUTI1 OUT1 
OUT2 OUT2 
OUT3 OUT3 
使 用 /选择 





图 2.27 带 使 能 端的 解码 器 


2.5.4 重组 数据 路 径 以 减少 转换 传播 


某 些 数据 路 径 中 的 元 件 ， 如 解码 器 或 比较 器 ， 以 及 “毛刺 的 ”逻辑 会 
显著 增加 功 耗 。 由 较 迟 到 达 的 信号 或 偏 移 所 引起 的 毛刺 ， 可 以 穿 过 其 他 数 
据 通路 器 件 和 逻辑 到 达 寄 存 器 。 因 为 信号 变化 引起 了 逻辑 电 平 的 翻转 ， 所 
以 这 种 传播 消耗 了 更 多 的 能 量 。 为 了 减少 这 种 损耗 ， 设 计 者 需要 重新 编写 
HDL 代码 以 尽 可 能 地 缩短 传播 路 径 的 长 度 。 图 2. 28 举例 说 明了 两 种 优先 
级 多 路 器 的 实现 方式 ， 这 里 “毛刺 的 ”和 “稳定 的 ”条 件 有 不 同 的 排序 
方式 。 


2.6 复位 信号 的 设计 策略 


在 为 ASIC 选择 复位 策略 之 前 必须 考虑 许多 设计 方面 的 问题 ， 如 使 用 
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图 2.28 数据 通路 重 排序 以 减少 切换 传播 


同步 复位 还 是 使 用 异步 复位 ， 是 否 每 一 个 触发 器 都 要 接收 到 复位 信号 等 。 

复位 最 基本 的 目的 是 使 SoC 进入 一 个 能 进行 稳定 操作 的 确定 状态 。 这 
可 以 避免 SoC 在 上 电 后 进行 人 随机 状态 而 死机 。 一 且 SoC 生产 出 来 ， 是 否 
需要 对 SoC 使 用 复位 就 由 系统 、SoC 的 应 用 环境 以 及 SoC 的 自身 的 设计 方 
式 来 决定 。 好 的 设计 指南 会 在 系统 没有 明确 要 求 的 情况 下 为 SoC 中 的 每 个 
触发 器 都 提供 复位 信号 。 在 某 些 情 况 下 ， 当 流水 线 的 寄存 器 〈 移 位 寄存 器 
触发 器 ) 在 高 速 应 用 中 使 用 时 ， 应 该 去 掉 某 些 寄存 器 的 复位 信号 以 使 设计 
达到 更 高 性 能 。 

设计 可 以 选择 使 用 异步 复位 或 同步 复位 ， 或 者 同时 使 用 两 者 。 两 种 复 
位 方式 各 都 有 各 自明 显 的 优点 和 缺点 ， 在 实际 的 设计 中 任何 一 种 方法 可 以 
有 效 使 用 。 设 计 者 必须 选择 最 适合 于 设计 本 身 的 复位 方式 。 


2. 6. 1 用 同步 复位 进行 设计 


同步 复位 的 复位 信号 只 有 在 时 钟 的 有 效 沿 到 来 时 才能 影响 或 者 复位 触 
发 器 的 状态 。 在 某 些 仿真 器 中 ， 根 据 电路 的 逻辑 ， 可 能 会 阻止 复位 信号 到 
达 触 发 器 中 。 这 只 是 仿真 中 出 现 的 现象 ， 并 不 存在 于 真实 的 硬件 中 。 

由 于 复位 树 的 高 扇 出 ， 复 位 相对 于 时 钟 周 期 可 能 是 一 个 “迟到 的 信 
号 ”。 即 使 复位 信号 经 过 了 复位 缓冲 树 的 缓冲 ， 也 要 尽 可 能 减少 其 到 达 本 
地 逮 辑 前 穿 过 的 逻辑 数量 。 

图 2. 29 展示 了 带 有 同步 复位 的 可 加 载 触发 器 的 RTL 代码 。 图 2. 30 为 
对 应 的 硬件 实现 。 
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module load syn ff ( cik, in, out, load, rst n); 
input clk, in, load, rst n; 
output out; 


always @(posedge clik) 


if, (trst Hm 

out <= 1'b0O; // sync reset 
else if {load) 

out <= in; // sync 


endmodule 





图 2.29 同步 复位 可 加 载 触发 器 的 Verilog RTL 代码 





图 2.30 ” 带 同 步 复位 的 可 加 载 触发 器 〈 硬 件 实现 ) 


使 用 同步 复位 会 出 现 的 一 个 问题 是 综合 工具 无 法 分 辨 复位 信号 和 其 他 
数据 信和 号。 综合 工具 可 能 产生 一 种 图 2. 31 所 示 的 电路 结构 。 

图 2.31 所 示 的 电路 在 功能 上 与 图 2. 30 中 的 完全 一 样 ， 区 别 仅 仅 在 于 
复位 与 门 在 多 路 器 之 外 。 现 在 ,思考 在 门 级 仿真 时 会 出 现 什么 现象 。 当 
“rst_n” 信 号 为 低 时 ， 能 使 多 路 器 的 两 个 输入 强制 为 0， 然 而 如 果 “load” 
是 未 知 状态 (X) 并 且 多 路 器 模型 是 翡 观 的 ， 这 时 和 触发 器 就 会 停 在 未 知 态 
(X) ， 而 不 会 复位 。 注 意 ， 这 只 是 仿真 过 程 中 出 现 的 问题 。 实 际 电 路 将 会 
正常 工作 ， 触 发 器 也 会 复位 到 0 值 。 

综合 工作 经 常会 提供 编译 指令 ， 以 告知 综合 工具 指定 的 信号 是 同步 复 
位 信号 (或 置 位 信号 )。 综 合 工具 会 将 该 信号 “ 拉 ” 得 尽 可 能 接近 触发 
器 ， 以 避免 初始 化 问题 的 发 生 。 
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2.31 同步 复位 可 加 载 触发 器 的 另 一 种 实现 方式 


推荐 的 方式 是 在 项 目 开始 时 把 这 些 指 令 加 入 RTL 代码 中 以 避免 重新 综 
合影 响 到 项 目 进 度 。 


2. 6.1.1 使 用 同步 复位 的 优点 


1) 同步 复位 一 般 能 确保 电路 是 100% 同步 的 。 

2) 同步 复位 会 综合 为 更 小 的 触发 器 ， 特 别 在 该 复位 信号 被 触发 器 的 
输入 逻辑 门 控 时 。 

3) 同步 复位 确保 复位 只 发 生 在 有 效 时 钟 沿 。 时 钟 可 以 作为 过 滤 掉 复 
位 毛刺 的 手段 。 

4) 在 一 些 设计 中 ,复位 必须 由 一 组 内 部 条 件 产 生 。 推 荐 在 这 样 的 设 
计 中 使 用 同步 复位 信号 ， 这 样 可 以 将 时 钟 之 间 的 复位 毛刺 过 滤 掉 。 


2. 6. 1.2 使 用 同步 复位 的 缺点 


并 不 是 所 有 ASIC 库 都 带 有 内 置 的 同步 复位 触发 器 。 因 为 同步 复位 信 
号 只 是 一 个 数据 信号 ， 所 以 很 容易 把 复位 逻辑 综合 到 触发 器 自身 之 外 〈 如 
图 2. 30 和 图 2. 31 所 示 ) 。 

1) 同步 复位 可 能 需要 一 个 脉冲 展 宽 器 ， 以 保证 复位 信号 能 出 现在 时 
钟 有 效 沿 处 。 在 进行 多 时 钟 设计 时 ， 这 是 必须 要 考虑 的 一 个 重要 问题 。 可 
以 使 用 一 个 小 计数 器 来 保证 具有 指定 周期 数 的 复位 脉冲 宽度 。 

2) 如 果 复 位 由 SoC 的 组 合 逻 辑 产生 或 复位 必定 经 过 多 级 组 合 逻 辑 ， 
就 会 存在 潜在 的 问题 。 在 仿真 过 程 中 ， 根 据 复位 的 产生 方式 或 在 功能 模块 
上 的 使 用 方式 ， 复 位 信号 可 能 标记 为 X。 问 题 并 不 是 得 到 了 一 个 什么 样 的 
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复位 信号 ， 而 是 该 复位 信号 是 否 可 以 容易 地 被 外 部 引 脚 控制 。 

3) 就 其 本 质 而 言 ， 同 步 复 位 需要 时 钟 以 复位 电路 。 在 出 于 节省 功 耗 
的 目的 而 使 用 门 控 时 钟 时 ， 就 可 能 出 现 问题 。 在 复位 信号 发 出 时 ， 时 钟 可 
能 关闭 。 在 这 种 情况 下 只 能 使 用 异步 复位 ， 并 在 时 钟 恢 复 前 移 除 复位 
信和 号 。 

如 果 ASIC/FPGA 有 内 部 三 态 总 线 ， 就 迫切 需要 时 钟 来 产生 复位 动作 。 
为 了 阻止 芯片 上 电 时 内 部 三 态 总 线 出 现 竞争 ， 芯 片 应 当 有 图 2. 32 所 示 的 
异步 上 电 复 位 。 


next_oe 








图 2.32 用 于 输出 使 能 的 异步 复位 


可 以 使 用 同步 复位 信号 ; 但 是 也 必须 使 用 复位 信号 直接 撤销 三 态 使 能 
( 见 图 2.33)。 这 种 同步 技术 的 优点 是 能 简化 复位 - 高 阻 这 一 路 径 的 时 序 
分 析 。 





next_oe 





图 2.33 用 于 输出 使 能 的 同步 复位 


2. 6.2 使 用 异步 复位 进行 设计 


异步 复位 触发 器 在 设计 时 加 入 了 一 个 复位 引 脚 。 通 过 低 电 平 有 效 的 复 
位 〈 在 设计 中 经 常 使 用 ) ， 当 该 信号 使 触发 器 的 复位 端 变 为 逻辑 低 电 平时 ， 
触发 器 进入 复位 状态 。 

图 2. 34 是 带 有 有 异步 复位 的 可 加 载 触发 器 的 RIL 代码。 图 2. 35 是 对 应 


2.6 复位 信号 的 设计 策略 


的 硬件 实现 图 。 


module load asyn ff ( clk, in, out, load, rst_n); 
input clk, in, load, rst n; 
output out; 


always @(posedge clk or nededge rst_n) 


1f (rot ny 

out <= 1b0; //'sync reset 
else if (load) 

Out <= ins // SyncC 


endmodule 


图 2.34 ”异步 复位 可 加 载 触发 器 的 Verilog RTL 代码 





图 2.35 异步 复位 可 加 载 触发 有 (硬件 实现 ) 


2. 6. 2. 1 使 用 异步 复位 的 优点 


1) 使 用 异步 复位 的 最 大 好 处 在 于 只 要 生产 方 提供 的 库 中 有 带 有 异步 
复位 的 触发 器 ， 就 能 保证 数据 路 径 上 是 干净 的 。 对 于 数据 路 径 时 序 已 经 很 
紧 的 设计 ， 无 法 承担 由 于 加 入 同步 复位 带 来 的 额外 单元 门 和 额外 线路 延 
迟 。 而 使 用 异步 复位 ,设计 人 员 就 能 保证 没有 任何 复位 信号 加 在 数据 路 径 


上 ( 见 图 2;35)。 


2) 异步 复位 最 明显 的 优势 电路 是 不 管 有 没有 时 钟 都 能 复位 。 综 合 工 


具 能 自动 推断 出 异步 复位 而 不 必 加 入 任何 综合 参数 。 








$ 
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2. 6.2.2 使 用 异步 复位 的 缺点 


1) 在 DFT 时， 如 果 异 步 复 位 信号 不 能 直接 被 WO 引 脚 驱动 ， 就 必须 
将 异步 复位 线路 与 复位 驱动 器 断 开 以 保证 DFT 扫描 和 测试 的 正确 。 

2) 蜡 步 复 位 最 大 的 问题 是 不 管 产生 或 撤销 复位 信号 ， 它 们 都 是 一 个 
异步 过 程 。 产 生 复位 信号 不 存在 问题 ， 但 是 撤销 时 就 出 现 了 问题 。 如 果 蜡 
步 复 位 在 触发 器 时 钟 有 效 沿 附近 释放 ， 触 发 器 的 输出 就 会 进入 亚 稳 态 ， 因 
此 SoC 的 复位 状态 就 会 丢失 。 

3) 异步 复位 的 另 一 个 问题 与 其 源头 有 关 ， 即 由 板 级 或 系统 复位 所 产 
生 的 噪声 或 毛刺 引发 的 伪 复 位 。 需 要 设计 毛刺 过 滤器 来 消除 复位 电路 上 毛 
刺 的 影响 。 如 果 在 系统 中 这 真是 一 个 问题 ， 那 么 设计 人 员 就 应 该 考虑 使 用 
同步 复位 的 方案 。 

4) 对 于 同步 和 异步 复位 ， 复 位 树 都 应 是 时 间 可 控 的 ， 以 确保 复位 
能 在 一 个 时 钟 周期 内 释放 。 必 须 在 设计 版 图 后 分 析 复 位 树 的 时 序 以 确保 
满足 时 序 要 求 。 解 决 这 个 问题 的 一 种 方法 是 使 用 分 布 式 复位 同步 触 
发 器 。 


2. 6. 3 ” 带 异 步 复位 和 异步 置 位 的 触发 器 


大 多 数 设 计 并 没有 既 包 含 异 步 置 位 又 包含 异步 复位 的 触发 器 ， 但 是 有 
时 需要 这 样 的 触发 器 。 
图 2. 36 是 异步 置 位 /复位 触发 器 的 Verilog RTL 代码 。 
module dff set reset ( clk, in, out, rst n, set n); 
input clk, in, rst n, set n; 


output out> 


always & (posedge clk or meqdeoge rst n or negedge set. n) 
fF (irat nn) | | 


~ out <= 1'b0; // async reset 
else if (iset n) 
out <= 1'bl; // async set 
else 
out <= in; 
endmodule 





图 2.36 可 异步 置 位 /复位 触发 器 的 Verilog RTL 代码 


综合 工具 能 正确 推断 出 带 有 异步 置 位 /复位 的 触发 器 , 但 是 在 仿真 时 
并 不 是 这 样 。 念 真 的 问题 是 只 在 置 位 、 复 位 或 时 钟 信 号 的 有 效 沿 才 进入 al- 
ways 块 。 
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如 果 复 位 信号 首先 有 效 ， 然 后 置 位 信号 有 效 ， 之 后 复位 信号 无 效 ， 触 
发 器 应 该 先进 入 复位 状态 ， 然 后 进入 置 位 状态 〈 见 图 2. 37 中 的 时 序 图 ) 。 


1 
! 
rst n @ { 
| 
| 1 
1 ! 
1 ! 
| @ 
set n | | 
| t 
! 
1 
! 
1 





图 2.37 任意 异步 置 位 /复位 条 件 下 的 时 序 波形 


由 于 以 上 所 有 输入 都 是 异步 的 ， 因 此 只 要 一 移 除 置 位 复位 就 应 该 有 
效 ， 但 是 在 Verilog 中 并 不 是 这 样 ， 因 为 在 下 一 个 时 钟 上 升 沿 到 来 前 ， 没 有 
其 他 方式 能 触发 always 块 。always 块 仅 对 于 图 2. 37 所 示 的 1 和 2 事件 才 触 
发 ， 并 跳 过 3 和 4 事件 。 

在 某 些 很 少见 的 设计 中 ， 人 允许 复位 和 置 位 同时 发 出 ， 然 后 复位 先 撤 
销 ， 修 复 这 种 仿真 问题 的 方式 是 将 自 校 验 码 附着 在 正确 的 编译 器 指令 中 对 
触发 器 建 模 ， 并 在 这 种 情况 发 生 时 将 触发 器 输出 强制 为 正确 的 值 。 建 议 最 
好 尽 可 能 避免 使 用 同时 带 有 异步 置 位 和 异步 复位 的 触发 器 。 

图 2. 38 所 示 的 代码 是 使 仿真 正确 ， 并 且 能 保证 综合 前 和 综合 后 仿真 
结果 一 致 的 修改 方案 。 


// Add Compiler specific directive to 
// ignore the following block during synthesis 
always @(rst n or set n) 


if (rst ER Hot nNn) foree gq ™ 1 
else release q; 

// End the compiler directive here 
endmodule 





2.38 带 异 步 置 位 /复位 触发 器 的 仿真 模型 


2. 6.4 移 除 异 步 复位 的 问题 


移 除 系统 中 的 异步 复位 会 使 芯片 进入 不 稳定 的 未 知 状态 。 在 释放 复位 
时 必须 要 特别 注意 避免 这 种 情况 的 发 生 。 在 使 用 同步 复位 时 ， 复 位 信号 的 
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前 沿 和 尾 沿 必须 远离 时 钟 的 有 效 边沿 。 
如 图 2. 39 所 示 ， 在 移 除 异步 复位 信号 时 ， 有 两 个 潜在 的 问题 。 


t= 路 径 延 迟 
t= 复位 恢复 时 间 








图 2.39 消除 异步 复位 的 恢复 时 间 问 题 


1) 违背 复位 恢复 时 间 。 复 位 恢复 时 间 指 复位 撤销 后 和 时 钟 再 一 次 置 
高 之 间 的 时 间 。 违 背 复位 恢复 时 间 会 使 寄存 器 数据 输出 端 出 现 数据 完整 性 
或 亚 稳 态 问题 。 

2) 复位 移 除 会 在 不 同时 序 元 件 的 不 同时 钟 周期 内 发 生 。 当 复位 移 除 
与 时 钟 上 升 沿 异 步 时 ， 在 复位 信号 和 /或 时 钟 信号 上 不 同 的 传播 延迟 会 导 
致 某 些 寄存 器 或 触发 器 提前 退出 复位 状态 。 


2.6.5 复位 同步 器 


在 2.6.4 节 中 提 到 解决 异步 复位 移 除 问题 的 方法 是 使 用 复位 同步 器 。 
对 于 使 用 异步 复位 信和 号 的 电路 ， 这 是 确保 正确 移 除 复位 最 常 使 用 的 方法 。 
如 果 没 有 复位 同步 器 ， 即 使 在 仿真 时 复位 能 正常 工作 ， 最 终 系统 中 的 异步 
复位 信号 仍然 是 无 效 的 。 

图 2. 40 中 设计 的 复位 同步 逻辑 最 好 用 于 异步 复位 和 同步 复位 。 

用 外 部 异步 复位 信号 来 复位 一 对 触发 器 ， 这 对 触发 器 异步 地 依次 驱动 
主 复位 信号 通过 复位 缓冲 树 ， 再 到 达 设 计 中 的 其 他 触发 器 。 然 后 整个 设计 
异步 复位 。 


2.6 复位 信号 的 设计 策略 # 41 






复位 分 布 缓冲 器 树 


图 2.40 复位 同步 器 模块 图 


通过 撤销 复位 信号 将 复位 移 除 ， 这 时 允许 第 一 个 主 复位 寄存 器 的 D 输 
入 端 信号 在 时 钟 控制 下 穿 过 复位 同步 器 。 在 复位 撤销 后 ， 典 型 情况 下 需要 
两 个 时 钟 上 升 沿 来 同步 移 除 主 复位 信号 。 
将 复位 信号 与 时 钟 脉冲 同步 需要 两 个 触发 器 ， 这 里 第 二 个 触发 器 用 于 
移 除 由 于 异步 撤销 的 复位 信号 与 时 钟 上 升 沿 过 于 接近 所 导致 的 亚 稳 态 。 
还 要 注意 的 一 点 是 在 移 除 复位 后 ， 第 二 个 触发 器 不 存在 亚 稳 态 问题 。 
复位 同步 器 的 第 一 个 触发 器 有 潜在 亚 稳 态 风险 的 原因 是 其 输入 固定 为 高 电 
平 ， 输 出 异步 复位 为 0 并 且 复 位 可 能 在 触发 器 规定 的 恢复 时 间 内 移 除 〈 复 
位 可 能 与 同一 个 触发 器 的 时 钟 输入 上 升 沿 过 于 接近 ) 。 这 就 是 需要 第 二 个 
触发 器 的 原因 。 
复位 同步 器 中 的 第 二 个 触发 器 不 会 出 现 恢复 时 间 亚 稳 态 问题 ， 因 为 在 
移 除 复位 时 该 触发 器 的 输入 和 输出 都 为 低 电 平 。 由 于 这 个 触发 器 的 输入 和 
输出 没有 差别 ， 因 此 其 输出 也 就 没有 机 会 在 不 同 逻辑 值 之 间 振 荡 。 下 面 的 
等 式 计算 了 总 的 复位 分 布 时 间 : 
全 dis 
式 中 tu-d= 复 位 同步 器 中 第 二 个 触发 器 的 时 钟 端 到 Q 端的 传播 延迟 
ta = 通过 复位 分 布 网 络 树 的 总 延迟 
to = 目标 触发 器 的 恢复 时 间 


= 


2. 6.6 过 滤 复位 毛刺 


异步 复位 对 毛刺 很 敏感 ， 这 就 意味 着 任何 满足 触发 器 最 小 复位 脉冲 宽 
度 的 输入 都 能 引起 触发 器 复位 。 如 果 复 位 线 受 到 毛刺 的 影响 ， 这 就 真 的 成 
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为 问题 了 。 在 设计 中 ， 可 能 没有 足够 高 频 的 采样 时 钟 来 检测 复位 上 的 小 毛 
刺 ; 本 节 将 会 介绍 过 滤 掉 毛刺 的 方法 。 该 方法 需要 一 个 数字 延 时 来 过 滤 
毛刺 。 复 位 输入 引 脚 也 必须 是 施 密 特 触发 器 引 脚 才 有 助 于 毛刺 过 滤 。 
图 2. 41 显 示 了 复位 毛刺 滤波 器 的 电路 和 时 序 图 。 





图 2.41 复位 毛刺 过 滤 


为 了 加 入 延 时 ， 一 些 生产 商 提供 了 用 于 延迟 且 能 够 手动 实例 化 的 宏 单 
元 。 如 果 没 有 这 样 的 宏 单元 ， 设 计 人 员 就 需要 在 优化 后 的 已 综合 设计 中 手 
动 加 入 延 时 。 第 二 种 方法 需要 创建 一 个 包含 较 慢 缓冲 器 的 模块 ， 再 多 次 实 
例 化 该 模块 以 达到 所 期 望 的 延迟 。 基 于 这 种 思想 ， 可 以 产生 许多 变种 的 解 
决 办 法 。 

由 于 该 方法 使 用 了 延迟 链 ， 因 此 一 个 缺点 是 所 产生 的 延迟 会 随 着 温 
度 、 电 压 和 工艺 而 变化 。 必 须 注意 确保 延迟 在 所 有 PVT 环境 下 都 能 满足 设 
计 要 求 。 


2.7 控制 时 钟 偏 移 


整个 芯片 中 时 钟 信号 到 达 时 间 的 差异 称 为 时 钟 偏 移 。 时 序 必须 满足 寄 
存 器 建立 和 保持 时 间 的 要 求 是 基本 的 设计 原则 。 数 据 传播 延迟 和 时 钟 偏 移 
都 用 于 与 之 相关 的 计算 。 对 于 同一 时 钟 边沿 偏 移 较 大 的 寄存 器 ， 如 果 顺 序 
相 邻 ， 那么 在 向 其 提供 时 钟 时 ， 就 会 有 违背 时 序 的 潜在 风险 ,其 至 使 功能 
失效 。 这 是 ASIC 设计 失败 最 主要 的 原因 。 

图 2. 42 是 两 个 顺序 相 邻 触发 器 时 钟 偏 移 的 例子 。 


2.7 控制 时 钟 偏 移 凶 43 








图 2. 42 ”两 个 顺序 相 邻 触 发 器 的 时 钟 偏 移 


给 定 两 个 顺序 相 邻 的 触发 器 忆 和 下 以 及 一 个 等 电位 时 钟 分 布 网 络 ， 
这 两 个 触发 器 之 间 的 时 钟 偏 移 定 义 为 : 
了 SGW5 = La =— Le 
这 里 7. 和 7。 分 别 是 从 时 钟 源 到 触发 器 F 和 下 的 延迟 。 


2.7.1 短路 径 问题 


时 钟 偏 移 中 的 短路 径 问 题 与 触发 器 的 保持 时 间 违 背 很 相似 。 在 两 个 相 
邻 触发 器 之 间 的 数据 传播 延迟 比 时 钟 偏 移 还 短 时 ， 就 会 出 现 该 问题 。 

图 2. 43 中 的 电路 图 和 时 序 图 可 以 说 明 短路 径 问题 。 

由 于 同一 个 时 钟 沿 到 达 第 二 个 触发 器 比 新 数据 要 慢 ， 因 此 第 二 个 触发 
器 在 与 第 一 个 触发 器 同样 的 边沿 处 ， 切 换 为 与 第 一 个 触发 器 同样 的 值 。 这 
会 使 02 在 与 U1 同一 个 边沿 处 移 位 同样 的 数据 ， 最 终 导致 功能 错误 。 


2.7.2 时 钟 偏 移 和 短路 径 分 析 


之 前 提 到 ， 在 两 个 顺序 上 相 邻 的 触发 器 之 间 的 数据 路 径 传播 延迟 比 两 
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Ql » 1 
期 望 出 现 变化 的 位 置 
1 


图 2.43 含 短路 径 问 题 的 电路 


者 之 间 的 时 钟 偏 移 小 时 ,会 出 现时 钟 偏 移 和 短路 径 问题 。 
图 2. 44 中 的 延迟 如 下 所 示 。 


D1 Q2 





~~、_ Tw 布线 延迟 _ 一 


Te 


图 2.44 简单 电路 中 的 通用 延迟 模块 


7. : 第 一 个 触发 器 的 时 钟 输出 延迟 。 
Tua : 从 第 一 个 触发 器 的 输出 到 第 二 个 触发 器 输入 的 传播 延迟 。 
Tuo: 第 二 个 触发 器 的 时 钟 到 达 时 间 与 第 一 个 触发 器 的 时 钟 到 达 时 间 


2.7 控制 时 钟 偏 移 


之 差 5 ， 
在 以 下 条 件 下 ， 会 出 现 明显 的 短路 径 问 题 
(I 全 用 放生 oi 
这 里 Tao 是 第 二 个 触发 器 的 保持 时 间 。 
该 区 域 如 图 2. 45 所 示 。 


SK 


SK | 情况 A: 无 问题 SK < Tl-H 
情况 B: 有 问题 SK > 71-H 
情况 C: 有 问题 SK > 71-H 


图 2.45 短路 径 问 题 图 解 


因此 ,为 了 识别 带 有 该 问题 的 路 径 ， 用 户 必须 提取 出 时 钟 偏 移 (如 


Tuo) 和 短路 径 延 迟 (如 Ti Ta 示 HOLD2 ) o 


2.7.3 使 时 钟 偏 移 最 小 化 


将 时 钟 偏 移 减 至 最 小 值 是 解决 短路 径 问 题 的 最 好 方式 。 将 设计 中 的 时 
钟 偏 移 保 持 在 触发 器 的 最 小 延迟 之 下 能 提高 设计 对 所 有 短路 径 问 题 的 健 


壮 性 。 


下 面 几 节 介绍 一 些 众所周知 的 设计 技术 以 使 设计 对 时 钟 偏 移 更 健壮 。 


2.7.3.1 在 数据 路 径 上 加 入 延迟 


如 图 2. 44 所 示 ， 通 过 在 数据 路 径 上 增加 延迟 (7. ) 而 最 终 使 整个 数 


据 路 径 的 延迟 大 于 时 钟 偏 移 ， 可 以 消除 短路 径 问题 。 


全 


45 


46 # 第 2 章 时 钟 和 复位 


在 数据 路 径 中 插入 的 延迟 必须 足够 大 以 保证 数据 路 径 延迟 一 定 能 大 于 
时 钟 偏 移 。 


2.7. 3.2 时 钟 反 转 


时 钟 反 转 是 避免 出 现 短路 径 和 时 钟 偏 移 问题 的 另 一 种 方法 。 在 这 种 技 
术 中 ， 将 时 钟 相 对 于 数据 反 转 使 用 ， 这 样 就 自动 消除 了 时 钟 偏 移 。 

在 发 送 寄 存 器 接收 到 时 钟 沿 前 ， 时 钟 会 先驱 动 接收 触发 器 读 人 发 送 
( 源 ) 值 。 图 2. 46 是 实现 时 钟 反 转 方式 的 一 个 小 例子 。 





图 2. 46 时钟 反 转 方法 学 


可 以 看 出 ， 在 插 人 足够 多 的 延迟 后 ， 接 收 触 发 器 会 比 源 触 发 器 先 接收 
到 有 效 时 钟 沿 。 这 是 一 种 以 牺牲 建立 时 间 为 代价 提高 保持 时 间 的 方法 。 

时 钟 逆转 方法 对 于 约翰 逊 计数 器 和 线性 反馈 移 位 寄存 器 (LFSR) 这 
样 的 环 路 结构 并 不 是 很 有 效 ， 因 为 对 这 种 类 型 很 难 明确 定义 下 一 级 触发 
器 。 图 2. 47 是 一 个 使 用 时 钟 逆转 互联 的 环 路 结构 ， 可 以 看 出 , 在 U1 和 U3 
触发 器 之 间 存 在 短路 径 问 题 。 





图 2.47 环 路 结构 中 的 时 钟 反 转 
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2.7.3.3 交替 相位 时 钟 


避免 时 钟 偏 移 问题 的 已 知 方法 之 一 是 使 用 交替 相位 时 钟 。 下 面 几 节 介 
绍 几 种 交替 相位 时 钟 的 设计 技术 。 

交替 使 用 时 钟 沿 

在 这 种 方法 中 ,顺序 上 相 邻 的 触发 器 使 用 相反 的 时 钟 沿 触发 ， 如 
图 2. 48 所 示 。 





图 2.48 交替 边沿 时 钟 


这 种 方法 为 时 钟 偏 移 提供 了 约 半 个 时 钟 周 期 的 短路 径 时 钟 偏 移 
余 量 。 

交替 使 用 时 钟 相位 

图 2. 49 中 的 相 邻 触发 器 组 分 别 由 同一 时 钟 的 两 个 不 同 相 位 驱动 。 在 
这 种 情况 下 ， 任 意 两 个 相 邻 的 触发 器 之 间 都 有 与 两 个 相位 的 相位 差 大 致 相 
同 的 安全 余 量 。 





图 2. 49 ”交替 相位 时 钟 
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必须 注意 的 一 点 是 ， 交 替 使 用 时 钟 相 位 要 求 对 原始 时 钟 信号 使 用 完全 
不 同 的 时 钟 约 束 。 例 如 ， 在 交替 使 用 时 钟 边 沿 时 ， 由 于 相 邻 触发 器 由 同一 
个 时 钟 周 期 相反 的 边沿 驱动 ， 因 此 时 钟 频率 的 新 约束 值 应 该 时 初始 约束 频 
率 的 一 半 。 

行 波 时 钟 结构 

在 行 波 结构 中 ， 每 个 触发 器 的 输出 驱动 下 一 个 触发 器 的 时 钟 端 ， 这 与 
行 波 计数 器 的 实现 方式 类 似 。 只 有 在 源 触发 器 翻转 时 ， 下 一 级 触发 器 才 会 
被 时 钟 驱 动 ， 如 图 2. 50 所 示 。 





图 2.50 三 位 行 波 逐 减 计数 器 


在 图 2. 50 中 ,每 个 计数 触发 器 的 输出 驱动 下 一 个 触发 器 的 时 钟 端 ， 
而 不 是 数据 输入 端 。 由 于 触发 器 不 在 同一 个 时 钟 翻转 ， 这 就 消除 了 时 钟 仿 
移 。 第 一 个 触发 器 由 CLK 信号 的 正 沿 驱动 ， 第 二 个 和 第 三 个 触发 器 由 前 一 
个 触发 器 输出 信号 的 正 沿 驱动 。 

根据 设计 复杂 度 和 所 使 用 的 方法 学 ， 可 以 使 用 上 面 所 提 到 的 不 同 技术 
来 最 小 化 时 钟 偏 移 和 避免 短路 径 问 题 。 


2.7. 3.4 平衡 线路 长 度 


前 面 几 节 提 到 的 技术 都 应 在 项 目前 期 就 计划 使 用 。 当 然 作为 上 述 方案 
的 替代 ， 设 计 者 也 可 以 使 用 平衡 线路 长 度 的 方式 保证 低 时 钟 驱 动 器 偏 移 。 
除了 保持 所 有 时 钟 线 长 度 相等 ， 也 应 保证 各 终端 负载 相同 。 这 样 可 以 保证 
线路 长 度 恰当 地 平衡 。 

下 面 是 应 当 遵守 的 一 些 指南 。 

1) 紧密 关注 驱动 器 上 的 输入 - 输出 延迟 规范 。 

2) 在 时 钟 各 级 层次 上 使 用 同样 的 驱动 器 。 

3) 平衡 各 级 标 称 的 线路 延迟 。 

4) 在 各 条 线路 上 使 用 同样 的 终端 策略 。 
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5) 平衡 各 条 线路 的 负载 ， 这 可 能 意味 着 需要 在 一 条 支 路 上 添加 多 余 
电容 以 与 其 他 分 支 平衡 。 
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第 3 章 
处 理 多 个 时 钟 


只 涉及 单个 时 钟 的 设计 是 易于 实现 的 。 但 是 在 实践 中 ， 很 少 有 设计 只 在 
一 个 时 钟 下 运作 。 本 章 将 会 涉及 使 用 多 个 时 钟 的 设计 ， 并 介绍 在 设计 过 程 中 
所 遇 到 的 问题 和 处 理 方法 ， 最 后 得 到 可 以 工作 在 多 个 时 钟 下 的 健壮 设计 。 

单 时 钟 设计 〈 更 确切 地 说 ， 也 就 是 同步 设计 ) 如 图 3. 1 所 示 。 在 单 时 
钟 域 中 ， 有 单个 时 钟 贯穿 整个 设计 。 同 多 时 钟 设计 相 比 ， 这 样 的 设计 更 易 
于 实现 ， 并 且 更 少 产生 与 亚 稳 态 、 建 立 和 保 时 间 违 背 方 面 的 问题 。 








系统 时 钟 


图 3.1 单 时 钟 域 


3.2 多 时 钟 域 


对 于 工程 师 来 说 ， 开 发 含 多 个 时 钟 〈 见 图 3.2) 的 设计 是 一 种 挑战 。 
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这 样 的 设计 中 可 能 有 以 下 任何 一 个 ,或 者 全 部 类 型 的 时 钟 关系 : 





3.2 多 时 钟 域 


。 时 钟 的 频率 不 同 
。 时 钟 频率 相同 ,但 相位 不 同 
以 上 两 种 关系 如 图 3. 3 所 示 。 





同 频 不 同 相位 时 名 
图 3.3 多 时 钟 间 关系 (在 多 时 钟 域 中 ) 


3. 3 ”多 时 钟 域 设计 的 难题 


多 时 钟 设计 将 面临 下 列 问 题 : 
。 建立 时 间 和 保持 时 间 的 违背 
。 亚 稳 态 
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3. 3.1 违背 建立 时 间 和 保持 时 间 


建立 时 间 : 在 时 钟 脉冲 到 来 前 ， 输 入 数据 需要 保持 稳定 的 时 间 。 
保持 时 间 : 在 时 钟 脉冲 到 达 后 ， 输 入 数据 仍 需 保持 稳定 的 时 间 。 
图 3. 4 解释 了 相对 于 时 钟 上 升 沿 的 建立 时 间 和 保持 时 间 。 


建立 时 间 : 保持 时 间 : 
D 在 此 处 不 能 改变 DD 在 此 处 不 能 改变 





图 3.4 建立 和 保持 时 间 (相对 于 时 钟 边沿 ) 


建立 时 间 要 求 数据 必须 在 时 钟 上 升 沿 到 来 前 保持 稳定 ， 保 持 时 间 要 求 
在 时 钟 上 升 沿 到 来 后 数据 必须 仍然 保持 稳定 。 对 于 单 时钟 域 ， 这 样 的 要 求 
很 容易 满足 。 但 是 ， 在 多 时 钟 域 情 况 下 ， 很 容易 出 现 一 个 时 钟 域 的 输出 在 
另 一 个 时 钟 域 中 的 时 钟 上 升 沿 到 来 时 发 生 改 变 的 现象 。 这 将 会 引起 第 二 个 
时 钟 域 中 触发 器 的 输出 处 于 亚 稳 态 ， 由 此 导致 一 系列 错误 的 结果 。 

图 3. 2 中 所 示 的 是 一 个 双 时 钟 系统 ， 图 3. 5 中 所 示 的 是 这 样 一 个 系统 
中 信号 跨 时 钟 域 传输 的 时 序 图 。 如 图 3. 5 所 示 ，xclk_outputl (属于 xclk 时 










xclk_outputl i 


xclk_output2 


图 3.5 建立 和 保持 时 间 违 背 
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钟 域 ) 在 yclk 的 上 升 沿 附近 发 生 了 变化 。 即 xclk_outputl 信号 在 变化 期 间 
被 yclk 时 钟 域 采样 。 这 会 导致 相对 于 yclk 的 建立 时 间 和 保持 时 间 违 背 现象 
的 发 生 。 因 此 ， 在 yclk 时 钟 域 中 ， 依 赖 于 xclk_outputl 的 信号 将 进入 亚 稳 
态 并 产生 错误 的 结果 。 然 而 ，xclk_output2 (属于 xclk 时 钟 域 ) 在 yclk 的 
上 升 沿 处 是 稳定 的 。 所 以 不 会 出 现 建 立时 间 和 保持 时 间 违 背 的 问题 。 因 
此 ， 对 于 yclk 时 钟 域 中 的 信号 ， 如 果 依 赖 xclk_output2 信和 号， 将 会 产生 正 
确 的 输出 。 


3. 3.2 亚 稳 态 


由 多 个 时 钟 域 引 起 的 亚 稳 态 问题 已 经 在 第 1 章 中 做 了 详细 的 介绍 。 
后 序章 节 将 介绍 一 些 设计 技术 和 具体 的 解决 方法 ， 来 确保 得 到 一 个 稳 
定 可 靠 的 多 时 钟 域 设计 。 


3.4 ”多 时 钟 设计 的 处 理 技术 


在 进行 一 个 含 多 个 时 钟 的 设计 时 ， 在 仿真 和 综合 过 程 中 遵循 一 定 的 准 
则 将 会 带 来 很 大 的 好 处 。 一 些 通用 的 准则 如 下 : 

。 时 钟 命名 规则 

。 分 模块 设计 


3.4.1 时钟 命名 法 


为 了 保证 综合 脚本 可 以 更 轻松 地 处 理 所 有 的 时 钟 信 号 ， 有 必要 对 整个 
设计 使 用 一 个 确定 的 命名 步 又。 例如 ， 系 统 时 钟 可 以 命名 为 sys_clk， 发 送 
时 钟 可 以 命名 为 g_clk， 接 收 时钟 可 以 命名 为 x_clk 等 。 这 样 就 可 以 在 脚 
本 中 使 用 通配符 来 对 所 有 时 钟 进行 操作 。 同 理 ， 属 于 同一 个 时 钟 域 的 信 
号 ， 也 应 该 在 命名 时 使 用 同样 的 前 级 。 例 如 ， 由 系统 时 钟 驱动 的 信号 ， 可 
以 用 类 似 于 sys_rom_addr、sys_rom_data 这 样 的 方式 作为 起 始 。 

使 用 这 种 命名 法 ， 团 队 中 的 每 个 工程 师 便 可 以 分 辨 出 每 个 特定 的 信和 号 所 属 的 
时 钟 域 ， 并 决定 是 应 该 直接 使 用 该 信号 ， 还 是 需要 先 将 其 通过 同步 器 后 再 使 用 。 

这 样 的 命名 过 程 能 极 大 地 减少 对 信号 的 混淆 ， 并 在 各 模块 之 间 提 供 简 
单 的 接口 ， 因 此 提高 了 团队 的 工作 效率 。 
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3.4.2 分 块 化 设计 


这 是 设计 含 多 时 钟 的 模块 时 常用 的 另 一 种 有 效 技术 。 如 下 所 述 : 

1) 每 个 模块 只 应 当 在 单个 时 钟 下 工作 。 

2) 在 信号 跨 时 钟 域 传输 时 ,使 用 同步 器 模块 (该 模块 的 作用 是 将 信 
号 从 一 个 时 钟 域 转 递 到 另 一 个 时 钟 域 ) ， 以 使 所 有 信和 号 在 进入 某 个 时 钟 域 
内 的 模块 时 ， 与 该 模块 的 时 钟 保 持 同 步 。 

3) 同步 器 模块 的 规模 应 尽 可 能 小 。 

将 整个 设计 分 割 成 模块 的 优点 在 于 使 得 静态 时 序 分 析 变 得 很 简单 ， 因 
为 所 有 输出 或 输入 某 时 钟 域 的 信号 都 与 使 用 该 时 钟 的 模块 保持 同步 。 所 
以 , 设计 就 成 为 完全 同步 的 。 另 外 ， 对 于 同步 模块 是 不 需要 做 静态 时 序 分 
析 的 。 但 是 ， 要 保证 满足 保持 时 间 的 要 求 。 

如 图 3.6 所 示 ， 整 个 逻辑 分 成 了 三 个 时 钟 域 ， 分 别 是 Clockl 时 钟 域 、 
Clock2 时 钟 域 和 Clock3 时 钟 域 。 根 据 3. 4. 1 节 中 所 述 的 命名 规则 对 各 时 钟 
域 中 信号 进行 命名 。 所 有 跨 时 钟 域 传输 的 信号 都 要 经 过 一 个 额外 的 同步 模 
块 。 该 同步 模块 的 作用 是 将 信号 从 原来 所 在 的 时 钟 域 传 化 到 将 使 用 该 信号 
的 时 钟 域 。 因 此 ， 如 图 3.6 所 示 ,“ 从 1 同步 到 2” 模 块 将 信号 从 Clockl 时 
钟 域 转化 到 Clock2 时 钟 域 。 


Clk2 SigF 
Clock2 时 钟 域 


eseeocaeeaweoecceoscossoosecesec， 









Clockl 时 钟 域 


-eco 








Clkl_SigA 





人 Lecaimecoieao2meeeoseaeei 


图 3.6 设计 划分 


3.4.3 跨 时 钟 域 


跨 时 钟 域 信号 的 传输 可 以 归 为 两 类 ， 分 别 是 : 
。 控制 信号 的 传输 
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。 数据 信号 的 传输 
3. 4.3.1 控制 信号 的 传输 (同步 化 ) 


在 设计 中 ， 如 果 将 一 个 异步 信号 直接 送 给 若干 个 并 行 工作 的 触发 器 ， 
就 会 大 大 增加 亚 稳 态 事件 发 生 的 概率 ， 因 为 有 可 能 有 多 个 触发 器 进入 亚 稳 
态 。 为 了 避免 形成 这 种 情况 下 的 亚 稳 态 ， 我 们 常常 使 用 同步 触发 器 的 输出 
信号 来 取代 异步 信号 。 

为 了 减少 亚 稳 态 的 影响 ， 设 计 者 最 常用 的 方式 是 使 用 多 级 同步 器 ， 即 
将 两 个 或 多 个 触发 器 串联 起 来 组 成 的 同步 电路 ， 如 图 3. 7 所 示 。 











图 3.7 双 级 同步 电路 


如 果 同 步 器 的 第 一 级 触发 器 产生 亚 稳 态 输出 ， 那 么 这 个 亚 稳 态 会 在 同 
步 器 的 第 二 个 触发 器 取样 前 进入 稳 态 。 这 种 方法 无 法 保证 第 二 级 触发 器 的 
输出 一 定 不 会 出 现 亚 稳 态 ， 但 是 它 确实 降低 出 现 亚 稳 态 的 可 能 性 。 同 理 ， 
如 果 为 同步 器 增加 更 多 级 触发 器 ， 就 会 进一步 降低 出 现 亚 稳 态 的 可 能 性 。 

这 种 方法 的 一 个 缺点 ， 也 可 以 看 做 同步 器 电路 不 可 避免 的 开销 ， 就 是 
增加 了 电路 的 整体 延 时 。 

上 述 同步 电路 的 时 序 如 图 3. 8 所 示 。 














Src_data _ out | 
dest_clk | 
dest datal_out | 


dest_ data2 out : 


图 3.8 双 级 同步 电路 的 时 序 
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源 时 钟 域 使 用 sre_clk 作为 时 钟 ， 其 异步 输出 信号 (src_data_out) 输 
入 第 一 个 同步 触发 器 中 。dest_datal _in 信号 〈 即 第 一 个 同步 触发 器 的 输 
出 ) 进入 亚 稳 态 ， 但 是 在 第 二 个 同步 电路 取样 前 会 进入 稳定 状态 。 因 此 把 
dest_data2_in 信号 〈 第 二 个 同步 触发 器 的 输出 ) 同步 化 到 目的 时 钟 域 的 
dest_clk 时 钟 。 

有 些 情况 下 ， 第 一 级 同步 器 触发 器 的 输出 信号 从 亚 稳 态 进入 稳定 状态 
所 需 的 时 间 可 能 需要 不 止 一 个 时 钟 周期 ， 这 就 意味 着 第 二 级 同步 触发 器 的 
输出 仍然 亚 稳定 。 这 时 为 安全 起 见 ， 应 当 使 用 三 级 同步 器 电路 。 

图 3. 9 是 一 个 三 级 同步 器 电路 的 例子 。 


钟 域 1 


( 源 时 钟 域 ) 








图 3.9 三 级 同步 电路 


三 级 同步 器 电路 由 三 个 串联 的 触发 器 组 成 。 第 二 级 触发 器 可 能 输出 的 
亚 稳 态 信号 在 第 三 级 触发 器 采样 前 会 进入 稳定 状态 。 
三 级 同步 器 电路 的 时 序 如 图 3. 10 所 示 。 
















sre_data_out 
dest_clk 

dest datal out 
dest data2 out 


dest data3 out : 


3.10 三 级 同步 电路 的 时 序 


源 模块 的 异步 输出 信号 (src_data_out0) 工作 在 src_clk 时 钟 下 ， 并 送 
给 第 一 个 同步 器 触发 器 。 信 和 号 dest_datal in (第 一 个 同步 触发 器 的 输出 信 
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号 ) 进入 亚 稳 态 , 但 可 以 在 多 个 时 钟 周期 的 时 间 里 恢复 到 稳定 状态 。 在 这 
段 时 间 内 ， 第 二 个 触发 器 会 对 第 一 个 触发 器 的 输出 进行 采样 ， 于 是 信号 
dest_data2_in 〈 第 二 个 同步 器 触发 器 的 输出 ) 也 会 进入 亚 稳 态 。 如 图 所 示 ， 
在 第 三 个 触发 器 取样 前 ， 该 信号 可 以 进入 稳定 状态 。 用 这 种 方式 可 以 将 
src_clk 时 钟 域 的 异步 输出 信号 同步 到 dest_clk 时 钟 域 中 。 

尽管 如 此 ， 在 大 多 数 多 时 钟 域 设 计 中 ， 使 用 两 级 同步 电路 就 足以 避免 
亚 稳 态 的 出 现 了 。 所 以 ， 只 有 在 时 钟 频 率 非常 高 的 设计 中 才 要 求 使 用 三 级 
同步 器 电路 。 


3. 4. 3.2 数据 信号 的 传输 


在 多 时 钟 域 设 计 中 ， 数 据 经 常会 从 一 个 时 钟 域 传 输 到 另 一 个 时 钟 域 。 
以 下 是 保证 数据 正常 地 在 不 同时 钟 域 间 传输 的 两 种 方法 : 

。 使 用 握手 信号 的 方式 

e。 使 用 异步 FIFO 

以 上 两 种 技术 将 在 3.6 节 和 3.8 节 中 详细 介绍 。 


3.5 跨 时 钟 域 


在 第 4 章 介绍 各 种 在 异步 时 钟 域 间 传输 数据 的 方法 之 前 ， 让 我 们 在 本 
节 中 先 来 看 看 跨 同 步 时 钟 域 问 题 的 各 种 类 型 。 

如 果 多 个 时 钟 都 起 源 于 同一 时 钟 ， 并 且 它 们 的 相位 和 频率 关系 是 已 知 
的 ,那么 这 些 时 钟 可 以 看 成 是 跨 同 步 时 钟 域 的 时 钟 。 按 照相 位 和 频率 的 关 
系 ， 可 以 将 这 些 时 钟 分 成 以 下 类 型 ; 

。 同 频 零 相位 差 时 钟 

。 同 频 恒定 相位 差 时 钟 

。 非 同 频 可 变相 位 差 时 钟 

加 整数 倍 时 钟 
图 有 理 数 倍 时 钟 

下 一 节 假 定 两 个 时 钟 之 间 的 相位 和 时 钟 抖动 相同 ， 并 假定 它们 之 间 的 路 
径 已 经 按 同 样 的 时 钟 延 迟 和 偏 移 参数 进行 了 平衡 。 除 此 之 外 ， 还 假设 这 两 个 
时 钟 起 始 处 的 相位 差 为 零 ， 而 且 触 发 右 的 “时 钟 到 Q 端 ” 的 延 时 也 为 零 。 


3.5. 1 同 频 零 相位 差 时 钟 
在 此 种 情形 下 ， 两 个 完全 相同 的 时 钟 “clkl1” 和 “clk2” 具 有 同样 的 
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频率 与 零 相 位 差 。“clkl1” 和 “clk2” 是 完全 相同 的 ， 并 由 同一 个 时 钟 源 产 
生 , 在 “clk1” 和 “clk2” 之 间 的 数据 传输 并 不 算是 跨 时 域 的 。 实 际 上 ， 
这 种 情况 就 是 单 时 钟 设计 ， 在 这 里 仅仅 是 出 于 全 面 考虑 才 提 及 它 。 

无 论 何 时 ， 从 “clkl” 到 “clk2” 的 数据 都 有 一 个 完整 的 有 效 时 钟 周 
期 用 于 传输 ， 以 保证 数据 可 以 正常 捕捉 ， 如 图 3. 11 所 示 。 





clk2 多 
A 1 
U 
i 
B | 
| 
一 个 时 钟 周期 可 用 于 数据 传输 


图 3.11 频率 和 相位 都 相同 的 时 钟 


只 要 在 源 触发 器 和 目的 触发 器 之 间 的 组 合 逻辑 的 延迟 能 满足 电路 建立 
和 保持 时 间 的 要 求 ， 数 据 就 能 正确 地 传输 。 在 这 种 情况 下 ， 对 设计 的 唯一 
要 求 只 是 保证 STA (静态 时 序 分 析 ) 通过 。 如 果 这 一 条 件 满足 ， 就 不 会 出 
现 亚 稳 态 问题 和 数据 丢失 或 不 一 致 的 问题 。 


3.5.2 同 频 恒定 相位 差 时 钟 


这 些 时 钟 有 相同 的 时 钟 周期 ， 但 是 相位 差 恒定 。 典 型 例子 是 对 某 个 时 
钟 及 其 反 相 时 钟 的 使 用 。 另 一 个 例子 是 某 个 时 钟 相 对 于 其 上 级 时 钟 发 生 了 
相位 移动 ， 例 如 ， 如 果 规 定 了 为 时 钟 周期 移动 值 为 T/4。 

如 图 3.11 所 示 ， 时 钟 “clkl1” 和 “clk2” 的 频率 相同 , 但 在 图 3. 12 
中 “clk1” 相 对 于 “clk2” 相 位 前 移 了 3T/4 个 单位 时 间 。 


<—3T/4—% 
3/4 个 时 钟 同期 可 用 于 数据 捕获 


图 3. 12 频率 相同 但 相位 移动 的 时 钟 
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每 当 数 据 从 “clk1” 传 输 到 “clk2” 时 ， 由 于 更 小 的 建立 时 间 / 保 持 时 
间 裕 量 ， 对 组 合 逻 辑 的 延 时 约束 都 会 变 得 更 紧 。 如 果 组 合 逻 辑 的 延 时 能 保 
证 满足 采样 沿 处 建立 时 间 和 保持 时 间 的 要 求 ， 数 据 就 可 以 正确 地 传输 ， 并 
且 不 会 有 亚 稳 态 产 生 。 在 这 种 情况 下 是 不 需要 同步 器 的 。 只 需要 使 设计 的 
STA 通过 就 可 以 了 。 

一 般 会 在 STA 中 创建 这 种 情况 以 保证 满足 时 序 要 求 。 如 果 组 合 逻 辑 有 
更 多 延 时 ， 通 过 在 发 射 边沿 和 捕获 边沿 加 入 偏 移 〈 例 如 ， 使 时 序 有 相同 频 
率 和 不 同 相位 ) ， 会 有 助 于 满足 时 序 的 要 求 。 


3. 5.3 非 同 频 、 可 变相 位 差 时 钟 


这 类 时 钟 具有 不 同 的 频率 ,而 且 相 位 差 也 是 可 变 的 。 可 以 将 这 类 时 钟 
分 为 两 个 子 类 ， 第 一 子 类 中 各 时 钟 周期 之 间 是 整数 倍 的 关系 ， 第 二 子 类 中 
各 时 钟 周期 是 非 整 数 倍 (有理数 倍 ) 的 关系 。 不 论 是 哪 一 子 类 ， 各 时 钟 有 
效 边 沿 的 相位 差 都 是 可 变 的 。 下 面 将 会 详细 介绍 这 两 种 情况 。 


3. 5. 3. 1 整数 倍 频 率 的 时 钟 


在 这 种 情况 下 ， 一 个 时 钟 的 频率 是 另 一 个 时 钟 的 整数 倍 ， 并 且 它 们 有 
效 边沿 的 相位 差 是 可 变 的 。 这 两 个 时 钟 的 有 效 边沿 之 间 可 能 的 最 小 相位 差 
始终 等 于 其 中 较 快 的 那个 时 钟 的 时 间 周 期 。 

在 图 3. 13 中 ， 时 钟 “elkl ”的 频率 是 时 钟 “clk2” 的 三 倍 。 假 定 T 是 
时 钟 “clkl” 的 时 钟 周期 ， 时 钟 “clk2” 可 以 用 来 捕获 数据 的 时 间 可 能 是 
T、2T 或 3T， 这 取决 于 数据 在 时 钟 “clk1” 的 哪个 边沿 发 出 。 因 此 ， 任 意 
路 径 的 最 差 延迟 都 应 在 时 钟 边 沿 相位 差 为 T 时 满足 建立 时 间 的 要 求 。 最 差 
保持 时 间 检 查 应 当 在 时 钟 边沿 相位 差 为 零 时 进行 。 

在 以 上 所 有 情况 下 ， 都 有 较 快 时 钟 的 一 个 完整 的 周期 用 来 传输 数据 ， 
以 使 其 能 正确 地 捕捉 ， 所 以 它 通常 都 可 以 保证 满足 建立 时 间 和 保持 时 间 的 
要 求 。 因 此 ， 就 不 会 存在 亚 稳 态 或 数据 不 一 致 的 问题 ， 也 就 不 必 使 用 同步 
器 了 。 

既然 在 这 里 数据 由 较 快 时 钟 发 出 ， 并 由 较 慢 时 钟 捕获 ， 那 么 为 了 避免 
数据 丢失 ， 源 数据 应 该 保持 至 少 一 个 目的 时 钟 周期 的 稳定 状态 。 可 以 使 用 
一 些 控制 电路 来 满足 这 一 要 求 ， 例 如 ， 使 用 一 个 简单 的 有 限 状态 机 
(FSM) 。 参 考 图 3. 13 ， 如 果 使 源 数据 每 三 个 源 时 钟 改变 一 次 ， 就 不 会 出 现 
丢 数据 的 问题 了 。 


多 第 3 章 处 理 多 个 时 钟 


数据 发 送 沿 


I 
ON 浅 可 
se 


1 [27 检查 建立 
时 间 的 时 站 沿 Le 3T 一 |。 时 间 的 时 名 沿 
根据 数据 发 送 点 使 用 T、2T 或 3T 捕 获 数据 


图 3.13 含 内 部 倍 频 的 时 钟 


3. 5. 3.2 非 整 数 倍 频率 的 时 钟 


这 种 情况 指 一 个 时 钟 的 频率 是 男 一 个 时 钟 的 非 整 数 倍 ， 而 且 它 们 有 效 
边沿 的 相位 差 是 可 变 的 。 

与 前 面 提 到 的 各 时 钟 之 间 保 持 整数 倍 关系 不 同 ， 因 此 两 时 钟 之 间 的 最 
小 相位 差 足 以 使 亚 稳 态 产生 。 至 于 亚 稳 态 是 否 真 的 发 生 ， 取 决 于 实际 的 频 
率 倍数 和 设计 工艺 。 下 面 介绍 三 种 不 同 的 情况 。 

在 第 一 种 情况 下 ， 在 源 时 钟 有 效 沿 和 目的 时 钟 有 效 沿 之 间 有 足够 大 的 
相位 差 ， 所 以 不 会 有 亚 稳 态 产生 。 

在 第 二 种 情况 下 ， 源 时 钟 和 目的 时 钟 有 效 沿 非常 接近 ， 导 致 产生 亚 稳 
态 问题 。 然 而 ， 在 这 里 时 钟 频率 倍数 关系 需要 满足 以 下 条 件 ， 即 一 旦 有 时 
钟 边 沿 接近 出 现 ， 下 一 个 时 钟 周 期 就 会 留 出 足够 大 的 时 间 宛 余 ， 使 得 数据 
的 捕获 不 会 出 现 违背 建立 时 间或 保持 时 间 的 要 求 。 

在 第 三 种 情况 下 ， 两 个 时 钟 的 时 钟 沿 在 许多 连续 的 周期 中 都 非常 接 
近 。 这 与 异步 时 钟 的 行为 很 相似 ， 但 因为 这 两 个 时 钟 的 源头 是 相同 的 ， 所 
以 它们 之 间 的 相位 差 是 可 以 计算 出 来 的 。 

注意 ， 在 下 面 的 所 有 例子 中 ， 会 使 用 某 些 延迟 值 ， 假 设 时 钟 边沿 之 间 
的 相位 宛 余 在 小 于 或 等 于 1. Sns 时 会 产生 亚 稳 态 。 这 里 的 1. 5ns 并 只 是 一 
个 比喻 ,在 实际 设计 中 与 所 用 技术 、 触 发 器 特征 等 许多 因素 相关 。 

例子 1 

在 这 种 情况 中 两 个 时 钟 的 有 效 沿 永 远 不 会 过 于 接近 ， 从 而 可 以 保留 足 
够 的 元 余 来 满足 电路 对 建立 时 间 和 保持 时 间 的 要 求 。 

假设 两 个 时 钟 “clk1” 和 “clk2” 分 别 是 对 同一 个 时 钟 “clk” 的 3 分 
频 与 2 分 频 。 那 么 “clk1” 比 “clk2” 慢 1.5 倍 。 如 图 3.14 所 示 , “clk1” 
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的 周期 是 15ns，“clk2” 的 周期 为 10ns。 这 两 个 时 钟 间 的 最 小 相位 差 是 
2. Sns， 这 对 于 满足 建立 时 间 和 保持 时 间 已 经 足够 了 。 


clkl | | | | | | | | 
| 
1 
a 
| | 
1 
一 一 记 | 一 
最 小 相位 差生 2.5Sns 
图 3.14 ”时钟 沿 相 距 较 远 所 以 避免 了 亚 稳 态 


然而 ， 由 于 该 相位 差 很 小 ， 应 该 避免 在 跨越 两 个 时 钟 的 位 置 使 用 任何 
组 合 逻 辑 。 对 于 增加 的 任何 组 合 逻 辑 ， 必 须 满足 建立 和 保持 时 间 的 要 求 以 
避免 亚 稳 态 ， 因 此 必须 使 用 同步 器 。 

进一步 说 ， 在 数据 从 人 慢 时 钟 域 传 递 到 快 时 钟 域 时 ， 必 须 增 加 逻辑 以 保 
证 数据 在 快 时 钟 域 中 只 取样 一 次 ， 这 时 不 会 有 数据 丢失 的 现象 。 然 而 ， 在 
从 快 时钟 域 向 慢 时 钟 域 传递 数据 时 ， 就 可 能 出 现 数据 丢失 。 为 了 解决 这 个 
问题 ， 必 须 将 源 数据 保持 至 少 一 个 目标 时 钟 周 期 ， 以 保证 在 两 个 连续 变换 
的 源 数 据 之 间 至 少 有 一 个 目标 时 钟 到 达 。 

例子 2 

在 这 种 情况 下 ， 两 个 时 钟 的 有 效 沿 可 能 间隔 性 地 非常 接近 。 换 句 话 
说 ， 两 个 时 钟 沿 会 出 现 挨 着 的 情况 ， 然 后 在 再 次 出 现 挨 着 的 情况 之 前 ， 接 
来 的 几 个 周期 两 个 时 钟 沿 会 保留 足够 的 裕 量 〈 能 正确 捕捉 到 数据 ) 。 这 里 
“ 挨 着 ”的 意思 是 接近 到 了 足以 产生 亚 稳 态 的 程度 。 

在 图 3. 1$ 中 ， 时 钟 “clkl1” 和 “clk2” 的 周期 分 别 为 10ns 与 7ns。 注 
意 ， 它 们 之 间 的 最 小 相位 差 是 0. Sns， 这 已 经 非常 小 了 。 所 以 会 出 现 亚 稳 
态 ， 并 且 必 须 使 用 同步 器 。 

由 于 亚 稳 态 的 出 现 ， 当 两 个 时 钟 沿 很 接近 时 数据 不 能 被 目标 域 正 确 地 
捕获 。 然 而 ， 在 这 种 情况 下 ， 注 意 ， 一 旦 出 现时 钟 沿 非常 接近 的 情况 ， 下 
一 个 周期 的 裕 量 就 会 很 大 ， 以 便 数 据 就 可 以 被 目标 时 钟 正 确 捕 获 。 图 3. 15 
中 的 信号 B2 就 表示 这 种 情况 。 所 期 望 的 输出 是 B1 ， 实 际 的 波形 是 B2。 注 
意 ， 这 里 数据 不 会 丢失 ， 但 是 可 能 有 数据 不 连贯 的 问题 。 

对 于 从 快 时钟 域 到 慢 时 钟 域 的 传输 ， 可 能 出 现 数据 丢失 ,为 了 阻止 这 
种 现象 ， 源 数据 应 该 保持 至 少 一 个 目标 时 钟 周 期 不 变 。 可 以 通过 使 用 一 个 
简单 的 FSM 实现 这 一 目的 。 
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数据 沿 聚集 在 一 起 最 小 相位 差 王 0.5hs 


clk2 


Bl 


二 
1 
| 
1 
| 
B2 
1 
| 





在 第 一 个 周期 捕获 的 数据 在 第 2 个 周期 捕获 的 数据 
由 于 亚 稳 态 丢失 的 数据 
图 3.15 间 软 性 聚集 的 时 钟 沿 


例子 3 

在 这 种 情况 下 时 钟 间 的 相位 差异 很 小 ， 并 能 连续 存在 几 个 周期 。 除 了 
变化 的 相位 差异 和 周期 性 的 重复 现象 ， 其 余 都 与 异步 时 钟 很 相似 。 

在 图 3. 16 中 ， 时 钟 “clkl1” 和 “clk2” 的 周期 分 别 为 10ns 与 9ns。 可 
以 看 出 两 个 时 钟 的 有 效 时 钟 沿 很 接近 ， 并 持续 4 个 连续 周期 。 在 前 两 个 周 
期 中 可 能 会 违背 建立 时 间 〈 源 时 钟 在 目的 时 钟 之 前 ) ， 而 在 后 两 个 时 钟 周 
期 中 可 能 会 违背 保持 时 间 (目的 时 钟 在 源 时 钟 之 前 ) 。 


时 钟 沿 连续 聚集 几 个 周期 


由 于 违背 建立 由 于 违背 保持 
时 间 丢失 数据 时 间 丢 失 数 据 


图 3.16 连续 聚集 几 个 周期 的 时 钟 沿 
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在 这 种 情况 下 ， 将 会 出 现 亚 稳 态 问题 ， 因 此 需要 进行 同步 。 除 了 亚 稳 
态 的 问题 ， 数 据 从 慢 时 钟 域 传递 到 快 时 钟 域 时 也 可 能 失 丢 。 可 以 从 图 3. 16 
中 可 以 看 到 ，B1 是 不 含 亚 稳 态 的 正确 输出 。 但 实际 的 输出 可 能 是 B2。 这 
里 数值 1 丢失 了 ， 因 为 第 一 个 周期 “1” 由 于 违背 建立 时 间 未 能 捕 提 到， 
而 在 第 二 个 周期 中 由 于 违背 保持 时 间 误 捕捉 到 了 “0”。 

为 了 不 丢失 数据 ， 数 据 需要 保持 稳定 至 少 两 个 目的 时 钟 周 期 。 这 既 适 
用 于 从 快 到 慢 的 传输 ， 也 适用 于 从 慢 到 快 的 传输 。 可 以 通过 使 用 简单 的 
FSM 对 源 数据 产生 进行 控制 完成 这 一 任务 。 但 数据 不 连贯 的 问题 仍然 
存在 。 

这 时 ,已 标准 化 的 技术 (如 握手 和 FIF0) 对 于 传输 数据 更 为 有 效 ， 
因为 它们 也 解决 了 数据 不 连贯 的 问题 。 


3.6 握手 信号 方法 


使 用 握手 信号 是 最 古老 的 在 不 同 域 之 间 转 输 数据 的 方式 。 
图 3. 17 是 由 两 个 时 钟 域 分 割 成 的 两 个 单独 的 系统 。 


xreq 





xclk yclk 





图 3.17 将 双 时 钟 域 划分 为 两 个 独立 的 系统 


使 用 握手 信号 “xack” 和 “yreq”,“ 系 统 X” 将 数据 发 送 给 “系统 Y”。 

下 面 是 使 用 握手 信号 传输 数据 的 例子 。 

1) 发 送 器 “系统 X” 将 数据 放 到 数据 总 线 上 并 发 出 “xreq” (请 求 ) 
信号 ， 表 示 有 效 数 据 已 经 发 到 接收 器 “系统 了 ”的 数据 总 线 上 。 

2) 把 “xreq” 信 号 同步 到 接收 器 的 时 钟 域 “yclk” 上 。 
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3) 接收 器 在 识别 “xred” 同 步 的 信号 “yreq2” 后 ， 锁 存 数据 总 线 上 
的 信号 。 

4) 接收 器 发 出 确认 信号 “yack”， 表 示 其 已 经 接受 了 数据 。 

5) 接收 器 发 出 的 “yack” 信 和 号 同步 到 发 送 时 钟 “xclk” 上 。 

6) 发 送 器 在 识别 同步 的 “xack2” 信 和 号 后 ， 将 下 一 个 数据 放 到 数据 总 线 上 。 

握手 信号 序列 的 时 序 如 图 3. 18 所 示 。 





人 
图 3.18 使 用 握手 机 制 传输 数据 的 时 序 图 


在 图 3. 18 中 可 以 看 出 ， 安 全 地 将 一 个 数据 从 发 送 器 传输 到 接收 器 需 
要 5 个 时 钟 周期 。 


3. 6. 1 握手 信号 的 要 求 


数据 应 该 在 发 送 时 钟 域内 稳定 至 少 两 个 时 钟 上 升 沿 。 
请 求 信号 “xreq” 的 宽度 应 该 超过 两 个 上 升 沿 时 钟 ， 否 则 从 高 速 时 钟 
域 向 低速 时 钟 域 传递 可 能 无 法 捕捉 到 该 信号。 


3. 6. 2 握手 信号 的 缺点 


跨 时 钟 域 传输 单个 数据 的 延迟 比 使 用 FIFO (在 后 面 章节 中 会 介绍 ) 
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传输 相同 的 数据 要 大 得 多 。 


3. 7 ”使 用 同步 FIFO 传输 数据 


在 设计 系统 时 ， 会 包含 工作 在 不 同时 钟 频率 下 的 元 件 ， 例 如 ， 处 理 
器 、 外 设 等 。 有 时 它们 可 能 有 自己 的 时 钟 振 功 器 。 数 据 在 这 些 元 件 之 间 传 
输 时 先进 先 出 (FIF0) 阵列 起 到 了 重要 作用 。FIFO 是 用 于 对 在 通信 总 线 
上 传输 的 数据 进行 排列 的 简单 存储 结构 。 

因此 ，FIFO 常用 来 传输 跨 不 同时 钟 域 的 数据 。 

本 节 介 绍 简 单 的 同步 FIFO 架构 ， 其 读 和 写 使 用 同样 的 时 钟 。 后 面 几 
节 会 详细 介绍 读 、 写 分 别 使 用 不 同时 钟 频率 的 异步 FIFO。 


3.7.1 同步 FIFO 架构 


图 3. 19 展示 了 一 个 同步 FIFO 的 通用 架构 。DPRAM ( 双 端 口 RAM) 
用 作 FIFO 的 存储 器 以 使 读 、 写 可 以 独立 进行 “1。 





3.19 同步 FIFO 架构 
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通过 读 、 写 指针 产生 各 自 的 读 、 写 地 址 ， 送 到 读 、 写 端口 。 写 指针 指 
向 下 一 个 要 写 人 的 地 址 ， 读 指针 指向 下 一 个 要 读 取 的 地 址 。 有 效 写 使 能 使 
写 指针 递增 ， 而 有 效 的 读 使 能 使 读 指针 递增 。 

图 3. 19 中 的 “状态 模块 ”“ 产 生 ”fifo_empty” 和 “fifo_ful” 信 号 。 
如 果 “fifo_ful” 有 效 ， 说明 FIFO 内 的 空间 已 满 不 能 再 写 人 人 数据。 如果 
“fifo_empty” 有 效 说 明 FIFO 内 没有 可 供 读 取 的 下 一 个 有 效 数据 。 通 过 对 两 
个 指针 进行 相同 的 逻辑 ， 该 模块 也 指示 出 任意 时 刻 FIFO 中 空 或 满 区 域 的 
个 数 。 

图 3. 13 中 所 示 的 双 端口 存储 器 (DPRAM) 可 以 同步 读 取 或 异步 读 取 。 
对 同步 读 操 作 ， 应 该 在 数据 在 FIFO 输出 端 有 效 前 提供 明确 的 读 信号 。 对 
于 异步 读 操 作 ，DPRAM 没有 寄存 的 数据 输出 ; 有 效 数据 在 写 和 人 后 即 可 用 
〈 先 读数 据 然后 递增 指针 值 ) 。 
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复位 后 读 写 指针 都 归 0。 此 时 “fifo_empty” 信 号 置 为 有 效 而 “fifo_full” 
保持 低 电 平 。 因 为 FIFO 为 空 ， 所 以 阻止 对 FIFO 的 读 操作 ， 只 能 进行 写 操 
作 。 后 序 的 写 操作 会 增加 写 指 针 的 值 ， 并 将 “fifo_empty” 信 和 号 置 为 无 效 。 
在 没有 空间 可 写 数 据 时 ， 写 指针 等 于 RAM_SIZE-1。 此 时 进行 一 个 写 操 作 
会 使 写 指针 回 滚 到 0， 并 将 “fifo_full” 信 号 置 为 高 电 平 。 

总 之 在 读 、 写 指针 相等 时 ，FIFO 要 人 么 空 要 么 满 ， 所 以 需要 对 这 两 种 情 
况 进 行 区 分 。 


FIFO 空 和 满 的 产生 


图 3. 20 显示 深度 为 4 的 FIFO 出 现 满 的 情况 。 


| orape 





图 3.20 ”FIFO 满 条 件 


图 3. 20 中 的 转换 发 生 在 随后 的 时 钟 中 。 如 图 3.20 所 示 ， 在 写 操作 使 
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两 个 指针 在 下 个 时 钟 保持 相等 时 ，FIFO 满 。 这 使 得 在 以 下 情况 会 发 出 


三 
fifo_full = (read_pointer = = (write_pointer +1))AND" write" (3.1) 


下 面 提供 了 产生 “fifo_full” 逻 辑 的 Verilog 代码 。 


always @ (posedge clk or nededge reset_n) 
begin: fifo_full_ gen 
if (~reset_n) 
fifo full < = 1*b0s 
else if (wr_fifo && rd fifo) 
;//do nothing 
else if (rd 五 fo) 
FOE <= 0 
elgse jf (we fifo &&e (Yd Ptr = wr pr + 1’l1)) 
to fulli es lb 
end 


类 似 地 ， 当 读 操 作 使 两 个 指针 在 下 一 个 时 钟 相等 时 ，FIFO 变 空 。 以 下 
情况 会 产生 “fifo_empty” 信 号 。 
fifo_empty = (write_pointer = = (read_pointer +1) ) AND" read" (3.2) 
下 面 提 供 了 产生 “fifo_empty” 逻辑 的 Verilog 代码 。 


always @ (posedge clk or negedge reset_n) 
begin: full_gen 
if (~reset_n) 
Eo £0l1 < = Jbl 
else if ( wr_fifo && rd fifo) 
; //do nothing 
else if (wr_fifo) 
fifo_ empty <= 1’'b0; 
else if (rd ffo && (rw ptr = rd PEr + 175L )) 
fifo empty <= 1'bl1; 
end 


3.7.2.2 另 一 种 方法 


另 一 种 产生 “fifo_full” 和 “fifo_empty” 状 态 的 方法 是 使 用 计数 器 来 
持续 指示 FIFO 中 空 或 满 位 置 的 个 数 。 

计数 器 的 宽度 要 与 FIFO 的 深度 相等 以 使 其 能 记录 FIFO 中 数据 的 最 大 
个 数 。 计 数 器 在 复位 时 初始 化 为 0。 随 后 的 任何 写 操作 会 将 其 递增 1， 任 何 
读 操作 会 使 其 递减 1。 

现在 ， 在 计数 器 值 为 0 时 ， 很 容易 就 判断 FIFO 处 于 空 状态 ， 而 当 计 
数 器 的 值 等 于 FIFO 的 大 小 时 ， 就 能 判断 出 FIFO 处 于 满 状 态 。 

本 节 提 到 的 这 种 方法 虽然 在 原理 上 简单 ， 但 是 与 3.7. 2.1 节 中 所 提 到 
的 方法 相 比 效率 要 低 一 些 。 因 为 这 种 方法 要 求 增加 额外 的 硬件 〈 比较 器 ) 
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来 产生 FIFO 空 和 满 的 条 件 。 随 着 FIFO 深度 的 增加 ， 比 较 器 的 宽度 也 会 增 
加 ， 因 此 产生 FIFO 空 、 满 信号 需要 更 高 级 的 序列 比较 器 。 这 最 终 会 降低 
FIFO 操作 的 最 高 频率 。 


3.8 异步 FIFO (或 双 时 钟 FIFO ) 


异步 FIFO 用 来 在 两 个 异步 时 钟 域 间 传输 数据 。 
图 3. 21 中 是 两 个 系统 ， 分 别 为 “System X” 和 “System Y”， 从 “Sys- 
tem X” 向 “System Y” 传输 数据 ， 两 个 系统 工作 在 不 同 的 时 钟 域 中 。 





图 3.21 用 异步 FIFO 传输 数据 


“System X” 使 用 “xclk” 将 数据 写 人 FIFO， 并 由 “ System Y” 使 用 
“yclk” 读 出 。 

“fifo_full” 和 “fifo_empty” 信 号 负责 对 上 溢 和 下 溢 情 况 的 监控 。 

“fifo_full” 信 号 指示 上 溢 情 况 。 在 “fifo_full” 置 起 时 数据 不 应 写 人 
FIFO， 否 则 会 将 FIFO 内 的 数据 覆盖 掉 。 

由 “fifo_empty” 信 号 指示 下 游 情况 ， 如 在 “fifo_empty” 时 不 应 读 取 
FIFO， 否 则 会 读 出 垃圾 数据 。 

与 握手 信号 不 同 ， 异 步 FIFO 用 于 对 性 能 要 求 较 高 的 设计 中 ， 尤 其 是 
时 钟 延 迟 比 系统 资源 更 为 重要 的 环境 中 。 

如 3.7 节 所 述 ， 简 单 的 同步 FIFO 可 以 通过 使 用 双 端 口 RAM 和 单独 的 
读 、 写 端口 来 实现 ， 读 写 操作 使 用 同一 个 时 钟 。 可 以 用 同样 的 原理 设计 异 
步 FIFO, 但 是 要 特别 注意 当 产 生 FIFO 空 和 FIFO 满 信 号 时 要 避免 出 现 亚 稳 
态 现 象 。 
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3. 8.1 避免 用 二 进 制 计数 器 实现 指针 


以 写 指针 为 例 。 在 写 请 求 有 效 时 ， 写 指针 在 写 时 钟 作 用 下 递增 。 同 
样 ， 在 读 请 求 有 效 时 读 指针 在 读 时 钟 作 用 下 递增 。 在 产生 FIFO 满 信号 时 ， 
要 将 写 指针 与 读 指针 进行 比较 ， 由 于 两 个 指针 与 分 别 与 其 各 自 的 时 钟 同 
步 , 但 是 彼此 之 间 异 步 ， 在 使 用 二 进 制 计 数 器 实现 指针 时 ， 就 会 导致 用 于 
比较 的 指针 值 取样 错误 。 这 在 下 面 说 明 。 

比如 ， 二 进 制 计数 器 的 值 会 从 FFF 变 为 000。 这 时 所 有 位 会 同时 改变 。 
虽然 能 通过 同步 计数 器 避免 亚 稳 态 ,但 是 仍然 能 得 到 极 不 相关 的 取样 值 ， 
所 以 同步 计数 器 不 是 最 终 的 解决 方案 。 

从 FFF 到 000 可 能 的 转换 : 

e FFF—»000 

e 上 FF 一 "001 

e 上 FF 一 "010 

e。 FFF- ”011 

e FFF—>100 

e FFF—>101 

e FFF—110 

e FF 一 *111 

如 果 同 步 时 钟 边 沿 在 FFF 向 000 转换 的 中 间 位 置 到 来 ， 就 可 能 将 三 位 
二 进 制 数 的 任何 值 取样 并 同步 到 新 的 时 钟 域 中 。 

因为 FIFO 满 和 FIFO 空 标记 的 产生 要 使 用 这 些 指针 的 值 ， 所 以 错误 
的 指针 值 将 会 误 产生 标记 。 可 能 是 在 FIFO 满 时 没有 产生 FIFO 满 标 记 ， 
从 而 使 数据 丢失 ; 或 在 FIFO 空 时 没有 产生 FIFO 空 标记 ， 从 而 读 出 垃圾 
数据 。 


葬 ] 注意 


鉴于 上 面 的 情况 ， 强 烈 建 议 避 免 使 用 二 进 制 计数 器 实现 读 、 写 指针 。 


3. 8.2 使 用 格雷 码 取 代 二 进 制 计数 


实现 FIFO 指针 的 一 种 方式 是 使 用 格雷 码 计数 ， 如 表 3. 1 所 示 。 
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同步 指针 的 影响 


表 3.1 格雷 码 编码 计数 器 
格雷 码 / 反 射 码 等 效 十 进 制 值 格雷 码 / 反 射 码 等 效 十 进 制 值 





格雷 码 相 对 于 二 进 制 编码 的 优势 在 于 在 从 一 个 数 变 为 另 一 个 数 时 ， 只 
有 一 位 出 现 变化 。 

要 得 到 不 同 的 格雷 码 ， 只 需要 从 任意 一 种 位 组 合 开始 ， 每 次 只 将 其 中 
一 位 随机 从 0 改 为 1 或 从 1 改 为 0， 就 可 以 得 到 其 他 格雷 码 。 因 此 格雷 码 
也 称 为 反射 码 。 

因为 格雷 码 是 单位 间距 码 ， 每 下 一 个 值 与 前 一 个 值 的 区 别 只 有 一 位 距 
离 ， 所 以 在 转换 中 最 多 只 会 出 现 一 位 错误 。 例 如 ， 如 果 计 数 器 从 “1010” 
变 为 “1011”， 取 样 逻 辑 要 人 么 读 到 “1010”( 旧 值 ) 要 么 读 到 “1011”( 新 
值 ), 但 是 不 会 出 现 其 他 值 。 


网 | 注意 
同步 格雷 码 计 数 器 很 少 会 导致 取样 计数 器 值 出 现 亚 稳 态 ， 此 外 取样 后 
的 值 最 多 只 有 一 位 出 现 错误 。 


在 FIFO 满 时 会 阻止 进一步 访问 FIF0。 在 FIFO 满 时 ， 按 各 自 时 钟 递 增 
的 读 、 写 指针 会 进行 比较 。 需 要 将 读 指针 (格雷 码 ) 同步 到 写 时钟 上 ,下 
面 用 例子 来 说 明 这 一 点 。 

如 图 3. 22 所 示 ， 最 初 在 阶段 读 、 写 指针 都 为 0。 随 着 后 续 发 生 在 
FIFO 上 的 写 操作 ， 写 指针 增加 。 当 到 达 某 个 阶段 时 ， 读 、 写 指针 相等 ， 这 
Re 





图 3.22 FIFO 满 逻 辑 的 同步 效果 
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fifo_full: : 
Actual fifo_full: : 








即使 FIFO 实 际 未 满 ， 也 会 阻止 
(在 tst# 期 间 ) 后 续 写 操作 


图 3.23 FIFO 满 时 序 


如 果 在 ts 处 发 生 了 读 操作 ， 由 于 上 典型 的 同步 电路 至 少 包含 两 个 触发 
器 ， 将 读 指 针 同 步 到 写 时 钟 上 将 会 导致 同步 后 的 读 指 针 在 两 个 写 时 钟 后 出 
现 。 这 虽然 增加 了 阻止 数据 写 人 的 周期 ， 但 是 对 数据 的 准确 性 是 无 害 的 。 
只 有 在 FIFO 实际 上 已 经 满 了 但 是 没有 阻止 写 动作 时 才 会 出 现 问题 。 

类 似 地 ， 在 FIFO 空 时 也 会 阻止 对 FIFO 进一步 的 读 访 问 。 

对 于 FIFO 空 计算 ， 把 写 指针 同步 到 读 时 钟 并 与 读 指 针 进 行 比较 。 因 此 ， 
在 读 一 边 延 迟 了 写 操 作 (延迟 了 两 个 时 钟 信号 ) 并 且 在 实际 上 有 数据 时 仍然 
会 指示 FIFO 为 空 。 这 会 导致 阻止 读 操作 ， 直 到 读 一 边 能 看 到 写 操作 为 止 。 

如 图 3. 24 所 示 ， 在 加 处 读 、 写 指针 初始 值 为 0。 随 着 对 FIFO 的 写 操作 ， 
写 指 针 增 加 。 在 某 个 阶段 写 指针 与 读 指针 相等 ， 这 时 FIFO 变 为 满 。 这 在 
图 3. 25 中 的 阶段 发 生 。 


rwtrptpl| 2 | 
ea CE— wtr -ptr 3 一 
-wtr_ptr»| 0 Ferd ptr- le pe Le 





k 一 人 | 一 2 FE 
rd -pt 
-站 = 寺 .= 十 ' 症 .= 
rd ptr—wtr ptrs| 0 lerd ptr-wtr ptr»| 0 | -wtr_ptr 
| kt kt | 一 吉 一 寺 ki 





图 3.24 FIFO 空 逻 辑 的 同步 效果 
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actual fifo: i 
empty = 





即使 FIFO 实 际 未 空 ， 也 会 阻止 
(在 b+ts 期 间 〉 后 续 读 操作 


3.25 FIFO 空 假象 


后 续 的 读 操作 从 ti 开始， 并且 FIFO 在 i 再 次 变 为 空 。 在 志和 is 又 写 
回 FIFO， 由 于 典型 的 同步 电路 由 至 少 两 个 触发 器 组 成 ， 将 写 指针 同步 到 读 
时 钟 上 时 将 会 导致 产生 最 少 两 个 读 时 钟 的 延迟 。 这 会 导致 阻止 对 FIFO 额 
外 的 读 操作 ， 但 这 是 无 害 的 。 只 有 在 FIFO 实际 上 为 空 时 没有 阻止 读 操作 
才 会 产生 问题 。 


加 ) 注意 

在 未 满 时 通知 写 一 边 FIFO 已 满 ， 或 在 未 空 时 通知 读 一 边 FIFO 已 空 都 
是 可 以 的 。 即 使 指针 同步 后 的 值 ( 写 时 同步 读 指针 以 及 读 时 同步 写 指针 ) 
会 持续 一 小 段 时 间 亚 稳 态 ， 阻 止 写 / 读 的 影响 会 使 FIFO 挂 起 一 段 时 间 ， 但 
是 不 会 导致 任何 错误 。 


3. 8. 3 用 格雷 码 实现 FIFO 指针 


要 想 完美 地 产生 FIFO 空 或 FIFO 满 条 件 ， 需 要 正确 取样 读 、 写 指针 
的 值 。 在 时 钟 域 间 传 递 指针 的 最 好 方式 是 使 用 格雷 码 来 实现 指针 ， 因 为 
如 果 同 步 时 钟 信 号 在 计数 值 转换 期 间 到 来 ， 这 种 编码 能 消除 绝 大 部 分 的 
错误 。 

设计 格雷 码 计数 器 看 起 来 复杂 ， 但 实际 上 很 简单 。 所 有 步骤 如 下 : 

步骤 工 : 将 格雷 值 转换 为 二 进 制 值 。 

步骤 开 : 根据 条 件 递增 二 进 制 值 。 

步骤 亚 : 将 二 进 制 值 转化 为 格雷 码 。 
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步骤 V: 将 计数 器 的 最 终 格雷 值 保 存 到 寄存 器 中 。 
图 3. 26 是 生成 的 格雷 码 计数 器 。 


| 一 步骤 1 中 一步 对 [一 -3 -步骤 -| 











保存 的 格雷 值 
图 3.26 使 用 二 进 制 加 法 器 的 格雷 码 计数 器 


3. 8. 3. 1 格雷 码 到 二 进 制 转换 器 
表 3. 2 是 分 别 以 格雷 码 和 二 进 制 方式 统计 的 4 位 计数 器 的 值 。 最 后 一 


列 是 按时 钟 递增 时 计数 器 的 转换 值 。 
表 3.2 格雷 码 / 二 进 制 计数 器 
格雷 值 二 进 制 值 等 效 十 进 制 值 
0000 0000 0 
0001 0001 1 
0011 0010 2 
0010 0011 3 
0110 0100 4 
0111 0101 5 
0101 0110 6 
0100 0111 5 
1100 1000 8 
1101 1001 9 
1111 1010 10 
1110 1011 11 
1010 1100 12 
1011 1101 13 
1001 1110 14 
1000 1111 15 


格雷 码 转 换 为 二 进 制 的 公式 是 : 
bin,., = gray,i (353》 
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bin, = gray; @ bin,,, (3.4) 
对 于 nn 位 计数 器 值 ，i <n -1。 
图 3. 27 为 计数 器 的 位 编号 。 


n-l] n-2 -一 -一 --- —-4 3 2 1 0 
| | | IW)| ls 
图 3.27 计数 器 的 位 编号 


让 我 们 举 个 简单 的 例子 ,将 格雷 码 “1010” 转 换 为 相等 的 二 进 制 数 。 
使 n-1=3 
将 i=3 代入 到 式 3.3 中 ,得 到 
bln = pray, =" pravt 3 1 
将 i=2 代入 到 式 3.4 中 ， 得 到 
bin, = gray, 中 bin; = gray, 由 gray = gray[2] 中 gray[3] = 1 
将 i=1 代入 到 式 3.4 中 ,得 到 


bin, = gray, 由 bin = gray: 由 gray, D grays = gray[1] OD gray[2] BD grayl3] = 0 
将 i=0 代入 到 式 3.4 中 ， 得 到 


bino = grayo @ bin, = grayo © gray! 由 gray, ©® gray; 
= gray[0] ©® gray[1] ©® gray[2] 四 gray[3] = 0 


所 以 我 们 得 到 下 面 4 个 等 式 
bin[0] = gray[0] © gray[1] 四 gray[2] 四 gray[3] (C353 
bin[1] = gray[1] © gray[2] © gray[3] (3.6) 
bin[2] = gray[2] ©® gray[3] (3:7) 
bin[3] = gray[3] (358) 


基于 以 上 的 等 式 ， 格雷 码 “1010” 对 应 的 二 进 制 数 为 “1100”。 
从 上 面 的 等 式 可 以 看 出 ，bin[3] 可 以 通过 将 格雷 值 右 移 3 位 得 到 。 


bin[2] 可 以 通过 将 格雷 值 右 移 2 位 得 到 ，bin[1] 可 以 通过 将 格雷 值 右 移 
1 位 得 到 ，bin[0] 可 以 通过 将 格雷 值 右 移 0 位 得 到 “|。 


下 面 是 上 面 的 格雷 码 到 二 进 制 码 转换 器 的 Verilog 代码 。 


module gray_to_bin (bin , gray); 
parameter SIZE = 4; 
input [SIZE] - 1:10] bin; 
output [SIZE - 1:10] gray; 
reg [SIZE - 1:10] bin; 
integer i; 
always @ (gray) 
二 OO 
了 LT (GEa >> 了 7 
endmodule 
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3. 8. 3.2 ”二进制 -格雷 码 转 换 器 
下 面 的 等 式 用 于 二 进 制 向 格雷 码 的 转换 : 


gray,1 = bin,. (359) 
gray; = bin, bin,,, 这 里 i <n-1 (3. 10) 
我 们 来 看 一 个 将 二 进 制 码 “1100” 转 换 到 对 应 格雷 码 的 简单 例子 。 


取 -1=3 
将 式 (3.9) 中 的 i 值 取 3， 得 到 
Brays = bin, = bin[3)] =1 
将 式 (3.10) 中 的 i 值 取 2， 得 到 : 
gray, = bin, @ bin; = bin[2] @ bin[3] 
将 式 (3.10) 中 的 i 值 取 1, 得 到 : 
gray: = bin, @ bin, = binL1] @ bin[2] 
将 式 (3.10) 中 的 i 值 取 0， 得 到 : 
grayo = bin, @ bin, = bin[0] @ bin[1] = 0 
这 样 就 得 到 了 已 知 二 进 制 码 “1100” 所 对 应 的 格雷 码 “1010”。 
基于 上 例 ， 我们 得 到 以 下 4 个 等 式 : 


[50 
ll 
© 


iD 
ll 
人 











gray[0] = bin[0] @ bin[1] (C301 
gray[1] = bin[1] ©@® bin[2] (3.12) 
gray[2] = bin[2] @® bin[3] (213) 
gray[3] = bin[3] (3-12) 


从 式 (3.11) ~ (3.14) 可 以 看 出 ， 可 以 通过 逐 位 异 或 ， 或 者 将 二 进 
制 码 右 移 后 与 自身 异 或 操作 的 方式 ， 计 算出 对 应 的 格雷 码 ， 如 下 所 示 : 
bin[3] bin[2] bin[1] bin[0] 一 二 进 制 值 : 二 进 制 
0 bin[3] bin[2] bin[1] 一 右 移 值 ( 二 进 制 ) 
gray[3] gray[2] gray[1] gray[0] 一 对 应 的 格雷 码 值 


下 面 是 上 述 二 进 制 -格雷 码 转换 器 的 Verilog 代码 : 


module bin to_gray (bin, gray); 
parameter SIZE = 4; 
input [SIZE-1:0] bin; 
output [SIZE-1:10] gray; 
assign gray = (bin >> 1) ^ bin; 
endmodule 


3. 8. 3.3 格雷 码 计 数 器 的 实现 
将 图 3. 26 中 的 所 有 四 个 步骤 组 合 在 一 起 (格雷 码 到 二 进 制 码 转 换 
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器 、 加 法 器 ， 二 进 制 码 到 格雷 码 转换 器 以 及 最 后 用 于 保存 格雷 值 的 寄存 
器 组 ) 。 
下 面 是 格雷 码 计 数 器 的 Verilog 代码 。 


module gray_ counter (clk, gray, inr, reset_n) 
parameter SIZE = 4; 
input clk, inr, reset_n;t 
output [SIZE -=1 ] gray’; 
reg [SIZE] - 1 ] gray_temp, gray, bin temp, bin; 
integer i; 


always @ (gray or inr) 
begin:gray_bin gray 
for {i = 07 Tene rs 1 本 3 


bint(li] = (oray >> 14)? // gray to binary conversion 
bin temp = bin + inr; // addition in binary 
gray. tenp = bin tenp >> 1) ^ bin temp; // binary to gray conversion 
end 
endmodule 


下 面 的 always 块 将 转换 后 的 格雷 值 寄存 起 来 : 


always @ (posedge clk or negedge reset_n) 
begin:gray_registered 
if (~reset_n) 
gray <= {SIZE {1’'b0}}; 
else 
gray <= gray_temp; 
end 


图 3. 28 是 以 上 格雷 码 计数 器 的 逻辑 原理 图 。 





图 3.28 格雷 码 计数 器 逻辑 


3.8.4 FIFO 满 和 FIFO 空 的 产生 


NN 位 指针 可 以 覆盖 FIFO 中 的 2” 个 地 址 。 在 两 个 指针 相等 时 ， 因 为 
FIFO 可 能 处 于 空 状态 也 可 能 处 于 满 状态 ， 所 以 需要 使 用 额外 的 位 来 对 这 两 


3.8 异步 FIFO (或 双 时 钟 FIFO) 。 


种 情况 进行 区 分 。 
当 二 进 制 码 指针 的 最 高 有 效 位 不 同 ， 而 其 余 位 相同 时 ，FIFO 为 满 。 
当 二 进 制 码 指针 的 所 有 位 都 相同 时 ，FIFO 为 空 。 下 面 用 一 个 例子 加 以 
说 明 ; 
例如 ， 一 个 深度 为 8 的 FIF0。 使 用 3 位 表示 所 有 8 个 位 置 ， 并 用 额外 
的 一 位 来 区 分 FIFO 满 或 空 。 一 开始 rd_ptr_bin 和 wr_ptr_bin 都 是 “0000”， 
FIFO 为 空 。 在 连续 8 次 写 FIFO 后 得 到 读 、 写 指针 的 值 为 : 
rd_ptr_bin = "0000" 
wr_pir_bin ="1000" 
这 就 是 图 3. 29 中 所 示 的 FIFO 满 状态 "1。 


























3.29 FIFO 满 条 件 


现在 连续 读 8 次 ,得 到 以 下 读 、 写 指针 值 : 
rd_ptr_bin = "1000" 
wr_ptr_bin ="1000" 
这 就 是 图 3. 30 中 所 示 的 FIFO 空 状态 。 





To oy 


Ce 
上 一 一 一 区 本 一 一 一 证 


图 3.30 FIFO 空 条 件 


图 3.31 是 FIFO 空 和 FIFO 满 的 模块 原理 图 。 
在 这 种 情况 下 ， 由 于 存在 XOR 门 链 路 ， 最 大 操作 频率 取决 于 格雷 码 
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计数 器 的 速度 。 

由 于 读 / 写 指针 的 值 以 格雷 码 保存 ， 而 所 有 的 比较 和 递增 操作 以 二 进 
制 码 形式 进行 ， 使 得 实现 和 纠 错 变 得 相当 简单 。 在 图 3. 31 中 ， 需 要 4 个 格 
雷 码 到 二 进 制 码 转换 器 ， 如 果 直 接 用 格雷 码 实 现 计算 FIFO 空 和 FIFO 满 进 
行 的 比较 等 操作 就 可 以 避免 使 用 这 些 转 换 器 。 这 会 增加 复杂 度 并 需要 额外 
的 逻辑 。 我 们 将 在 下 一 节 中 看 看 这 种 方法 是 如 何 工 作 的 。 


pr 
Td ptr syne b[N-1] 


| trd_ptr syne_b[N-2:0] . 


wr_ptr b[N-2:0] 二 = 





图 3.31 FIFO 满 和 空 信 号 产生 逻辑 


产生 FIFO 满 和 FIFO 空 的 另 一 种 方法 


该 方法 要 求 创 建 两 个 格雷 码 计 数 器 ,一 个 nn 位 ， 另 一 个 n-1 位。 可 
以 先 创 建 一 个 n 位 格雷 码 计 数 器 ， 然 后 通过 修改 其 第 二 个 MSB 来 产生 一 个 
n -1 位 的 格雷 码 计数 器 ， 这 两 个 计数 器 的 LSB 相同 中 。 

在 我 们 开始 主 逻 辑 之 前 ， 先 详细 了 解 格雷 码 计数 器 。 

图 3.32 是 4 位 格雷 码 计数 器。 

如 图 3. 32 所 示 ， 除 MSB 之 外 的 所 有 列 中 的 位 相对 于 中 线 是 对 称 的 。 
后 半 段 格雷 码 是 前 半 段 格雷 码 MSB 反 转 后 的 镜像 。 

现在 ， 就 可 以 将 并 位 格雷 码 中 2 个 MSB 进行 异 或 操作 后 的 值 作为 
n -1 位 格雷 码 的 MSB。 其 余 的 n-2 位 可 以 直接 用 位 格雷 码 的 n-2 位 
替代 。 图 3. 33 显示 了 4 位 到 3 位 格雷 码 的 转换 ( 见 表 3.3)。 
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MSB 以 外 的 所 有 位 置 都 关于 
中 心虚 线 对 称 





3.33 4 位 格雷 码 向 3 位 格雷 码 的 转换 


表 3.3 4 位 格雷 码 向 3 位 格雷 码 的 转换 
4 位 格雷 码 转换 后 的 3 位 格雷 码 4 位 格雷 码 转换 后 的 3 位 格雷 码 





在 下 一 节 的 FIFO 设计 中 ,会 介绍 如 何 将 双 位 格雷 码 计数 器 用 于 
FIFO 空 / 满 产 生 逻 辑 。 


3. 8.5 双 时 钟 FIFO 设计 


图 3. 34 中 是 使 用 双 端 口 存储 器 作为 存储 器 件 的 FIFO 模块 图 。 
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图 3.34 双 时 钟 FIFO 设计 


3. 8.5.1 FIFO 空 条 件 的 产生 


当 读 指针 与 同步 后 的 写 指 针 相 匹配 时 ，FIFO 为 空 ， 这 时 应 该 在 FIFO 
的 读 时 钟 域内 马上 产生 FIFO 空 标记 。 

注意 与 3. 8. 4 节 中 所 示 的 实现 方式 不 同 ， 这 时 比较 读 和 同步 化 的 写 指 
针 的 格雷 码 。 如 果 在 比较 前 指针 首先 转化 为 自身 的 等 效 二 进 制 码 ， 这 种 方 
式 就 能 节省 所 需要 的 4 个 格雷 码 到 二 进 制 码 转换 器 。 

与 之 前 的 实现 类 似 ， 指 针 宽 度 比 寻 址 FIFO 存储 器 所 需 的 宽度 多 一 位 。 
同步 后 的 写 指针 (wr_ptr_syne) 与 rd_gtemp 进行 比较 (下 一 个 格雷 码 将 保 
存在 rd_ptr 内 )。 

下 面 是 以 上 逻辑 的 Verilog 代码 。 


always @ (posedge rclk or negedge reset_n) 
begin: fifo_empty_gen 
if (~reset_n) 
fifo_empty <= 1’'b]; 
else 
fifo_empty <= (rd_gtemp = = wr_ptr_sync); 
end 


注意 
生成 的 FIFO 空 输出 寄存 起 来 。 
3. 8. 5.2 FIFO 满 条 件 的 产生 
当 写 指针 与 同步 化 的 读 指针 相等 时 ，FIFO 为 满 ， 这 时 应 该 在 FIFO 的 


3.8 异步 FIFO (或 双 时 钟 FIFO) 多 


写 时 钟 域内 马上 产生 FIFO 满 标 记 。 

注意 ， 应 直接 比较 写 指针 和 同步 化 的 读 指针 的 格雷 码 。 

与 之 前 的 实现 类 似 ， 指 针 宽 度 比 寻 址 FIFO 存储 器 地 址 所 需 的 宽度 多 
一 位 。 由 于 这 次 直接 使 用 格雷 码 而 不 是 二 进 制 码 对 指针 进行 比较 ， 因 此 产 
生 该 条 件 的 逻辑 与 之 前 的 实现 方式 不 同 。 

让 我 们 用 一 个 例子 来 做 以 说 明 。 

图 3. 35 中 是 深度 为 8 的 FIFO 执行 的 一 系列 步骤。 

步骤 1: FIFO 初 值 为 空 ， 即 “rd_ptr” = “wr_ptr” =0， 如 图 3. 35 
所 示 。 

步骤 2: 连续 写 FIFO0， 直 到 FIFO 满 ， 此 时 “rd_ptr”=0 目 “wr_ptr”=7。 
现在 连续 读 FIFO 至 “rd_ptr” = “wr_ptr”=7， 这 时 FIFO 变 空 (因为 读 
和 写 指针 的 所 有 位 相等 )， 如 图 3. 35 所 示 。 
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图 3.35 ”FIFO 满 和 空 条件 


步骤 3: 这 时 再 进行 一 次 写 操作 ， 使 “rd_ptr” =7 且 “wr_ptr” =8。 
如 果 使 用 之 前 的 二 进 制 码 比较 逻辑 ( 见 3. 8.4 节 )，FIFO 会 再 次 指示 满 ， 
即使 它 并 没有 满 〈 见 图 3.36) 。 

















读 指针 0 1 0 0 











图 3.36 ”FIFO 满 条 件 
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if (~reset_n) 
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第 4 章 
时 钟 分 频带 


典型 情况 下 SoC 要 对 设计 中 各 种 组 件 提供 许多 与 相位 相关 的 时 钟 。 将 
主 时 钟 以 2 为 寡 次 进行 分 割 来 产生 同步 偶数 分 频 时 钟 。 然 而 ， 有 时 也 会 需 
要 按 奇数 甚至 小 数 进行 分 频 。 在 这 些 情 况 下 ， 如 果 没 有 更 高 频 的 主 时 钟 ， 
无 法 得 到 同步 分 频 时 钟 。 

虽然 偶数 分 频 时 钟 始终 产生 50% 占 空 比 的 输出 ， 但 有 时 在 奇数 或 小 数 
分 频 时 也 需要 产生 50% 占 空 比 的 时 钟 。 本 章 提供 了 实现 这 些 不 常见 时 钟 分 
频 器 的 指南 和 细节 。 本 章 首先 介绍 简单 的 奇数 分 频 器 ( 按 3、5 等 分 频 )， 
然后 扩展 到 非 整数 分 频 器 ( 按 1. 5、2. 5 等 分 频 ) 。 所 描述 的 电路 比 选用 任 
何 外 部 PLL 都 更 为 简单 有 效 、 便 宜 和 快速 。 


4.2 同步 整数 分 频 器 


同步 整数 分 频 可 以 用 Moore 状态 机 很 容易 地 实现 。 
图 4. 1 使 用 Moore 状态 器 进行 7 分 频 。 
但 是 这 样 简单 的 逻辑 无 法 产生 50% 占 空 比 的 输出 。 
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图 4.1 7 分 频 Moore 状态 机 


4.3 具有 50% 占 空 比 的 奇数 整数 分 频 


在 概念 上 ， 产 生 具 有 50% 占 空 比 的 奇数 分 频 时 钟 最 简单 的 方式 是 以 期 
望 输出 频率 的 一 半生 成 两 个 正 交 相 位 时 钟 ( 两 个 时 钟 之 间 有 90° 相 位 差 ) 。 

然后 通过 将 两 个 波形 异 或 得 到 输出 频率 。 

由 于 存在 固定 的 90* 相 位 差 ， 每 次 异 或 输入 只 有 一 端 会 变化 ， 这 样 有 
效 消除 了 输出 波形 上 的 毛刺 。 

让 我 们 来 看 看 一 个 3 分 频 的 简单 例子 。 

下 面 列 出 整 奇 数 分 频 的 几 个 步骤 。 

步骤 工 : 创建 由 时 钟 上升 沿 触发 的 0 到 (W-1) 的 计数 器 ,，N 是 自然 
数 ， 用 于 对 参数 时 钟 进 行 分 频 (V 不 等 于 偶数 ) 

对 3 分 频 ， 从 0 计数 到 2…N=3 

对 5 分 频 : 从 0 计数 到 4…N=5 

对 7 分 频 : 从 0 计数 到 6…N =7 


网 注意 
计数 器 在 输入 时 钟 (ref_clk) 上 升 沿 累加 ， 在 到 达 (N -1) 后 自动 
归 零 。 
步骤 开 : 使 用 两 个 开关 触发 器 ， 按 以 下 方式 产生 其 使 能 信号 。 
tf1_en: TFF1 在 计数 值 为 0 时 使 能 。 
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tff2_en: TFF2 在 计数 值 为 (N+1)/2 时 使 能 (2 对 应 3 分 频 ，3 对 应 5 
分 频 ， 依 此 类 推 ) ， 如 图 4.2 所 示 。 





人 | : ee 
也 而 到 本 本 


| 4 i { 
: : i : i | 








图 4.2 具有 50% 占 空 比 的 3 分 频 时 序 图 (N=3) 


步 双 亚 : 产生 以 下 信号。 
divl : TFF1 的 输出 一 由 输入 时 钟 (ref_clk) 上 沿 触发 。 
div2: TFF2 的 输出 一 由 输入 时 钟 (ref_clk) 下 沿 触发 。 


加 | 注意 
两 个 了 触发 器 的 输出 “div1” 和 “div2” 产 生 2N 分 频 后 的 波形 ， 如 
图 4.2 所 示 。 


步骤 人 V: 通过 异 或 “div1” 和 “div2” 波 形 , 产生 最 终 输 出 时 钟 
“clkout” (NN 分 频 ) 
图 4.3 为 该 3 分 频 电路 的 逻辑 结构 图 。 


clkout = ref clk/3 一 > 





图 4.3 用 T 触 发 器 进行 50% 占 空 比 3 分 频 
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4.4” 非 整数 分 频 ( 非 50% 占 分 比 ) 
经 常会 使 用 N 分 频 电路 来 产生 与 参考 时 钟 不 同步 的 时 钟 。 设 计 N 为 非 
整数 的 分 频 电路 并 不 像 看 起 来 那样 难 。 让 我 们 来 看 一 下 1.5 分 频 的 含意 。 


简单 来 说 ， 就 是 每 三 个 参考 时 钟 包含 两 个 对 称 的 脉冲 。 
下 一 节 介 绍 一 个 时 钟 按 1. 5 分 频 的 非 50% 占 空 比 的 例子 。 


4.4.1 具有 非 50% 占 空 比 的 1.5 倍 分 频 


图 4.4 中 的 多 路 器 在 “clkout” 为 高 时 选择 ref_clk， 否则 它 选择 反 疝 
后 的 ref_clk。 


一 lbl Tef_clk/1.5 一 > 
> 


clkout 














图 4.4 使 用 T 触 发 器 进行 1.5 倍 分 频 〈( 非 50% 占 空 比 ) 


图 4.5 是 图 4.4 中 所 示 的 1.5 倍 分 频 电 路 的 时 序 图 。 


ref cjk 


clkout 
(ref clk/3 ) 


ref clk/1.5 


图 4.5 使 用 开关 寄存 器 进行 1.5 分 频 的 时 序 图 ( 非 50% 占 空 比 ) 


天] 注意 

上 述 电 路 在 仿真 时 可 以 正确 工作 ， 但 是 在 综合 时 可 能 出 现 问题 ， 因 为 
在 多 路 器 的 选择 端 切 换 开 关 时 两 个 输入 端的 延 时 并 不 相等 。 多 路 器 的 输出 
不 能 马上 改变 并 可 能 在 输出 时 钟 上 产生 毛刺 。 随 着 参考 时 钟 (ref_clk) 频 
率 的 增加 ， 出 现 错误 的 可 能 性 会 越 来 越 大 。 
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4.4.2 4.5 倍 分 频 计 数 器 的 实现 ( 非 50% 占 空 比 ) 


本 节 介 绍 另 一 种 方法 ， 可 以 对 非 整数 分 频 电 路 进行 优化 ， 使 其 输出 时 


钟 完全 不 含 毛刺 。 

让 我 们 使 用 4. 5 倍 分 频 的 例子 ， 即 每 9 个 参考 时 钟 包含 2 个 对 称 脉 冲 。 

下 面 是 非 整数 分 频 的 一 系列 步骤 。 

步骤 1: 使 用 复位 值 为 000000001 的 9 位 移 位 寄存 器 ， 可 以 在 每 个 时 
钟 上 升 沿 使 移 位 寄存 器 循环 左 移 一 位 。 

步骤 三 : 要 产生 第 1 个 脉冲 ， 必 须 使 在 半 周 期 时 移动 第 1 位 并 将 第 1 
位 与 第 2 位 进行 或 操作 。 

步骤 亚 : 要 产生 第 2 个 脉冲 ， 第 5 位 和 第 6 位 必须 在 半 周 期 时 移动 并 
与 原始 第 6 位 进行 或 操作 。 


加 注意 


所 有 这 些 移 位 都 是 用 来 保证 输出 波形 不 含 毛刺 的 必要 操作 。 


上 面 产生 的 时 钟 占 空 比 为 40% ， 并 且 输 出 不 含 毛刺 。 
图 4.6 是 4.5 分 频 电路 的 时 序 图 ， 下 面 是 该 逻辑 的 Verilog 代码 。 











ref clk 

count[9:1] 4 Ns ane 
count[9] Te 沽 请 大志 
ee | 人 
二 3 
cong 一 一 沁 是 于 重 
count[5] 一 | 
count[4] EE -十 二 


count[3] 

count[2] 

count[1] 

count[1] — 180° 
count[5] - 180° 

count[6] — 180° 
clkout (ref clk/4.5) 








图 4.6 4.5 售 分 频 计数 器 的 实现 ( 非 50% 占 空 比 ) 
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/* Counter implementation 
reset Value : 9’b000000001 */ 
always @ ( posedge ref _ clk or negedge p_n reset) 
if (!p.n_ reset) 
count [9:1] <= 9‘b000000001; 
else 
Count [9%1] <= count [9:1] << 4; 
/* ‘count blit 1*, SH angd 6 phase shifter by 180 deg */ 
always @ (negedge ref clk or negedge p_n reset) 
i£f (lp.m reset) 
begin 
pa cornnnmtl <= 二 DO; 
ps._counts <= 1°b0'; 
PSs_ count6. <= 1"b0R 
end 
else 
begin 
pS countl <= ountl[1ls 
Be eounts <= CGOUnELS] 


ps_count6 <= count[6]; 
end 


// Genration of final output clock = (ref clk / 4.5) 
assign clkout = (ps count 5 | ps, count 6 | count [6]) | 


(count (0 IMeoune tly | pe countl); 


4. 5 AN 分 频 的 替换 方法 


上 面 各 电路 都 假设 输入 时 钟 为 50% 占 空 比 ， 否 则 小 数 分 频 器 输出 会 出 
现 抖 动 ， 而 且 整 数 分 频 器 也 会 有 不 同 的 占 空 比 。 

所 有 使 用 基于 LUT (查找 表 ) 的 组 合 反馈 的 电路 都 能 工作 得 很 完美 ， 
并 产生 不 含 毛刺 的 时 钟 。 

让 我 们 再 次 回 到 简单 的 1. 5 分 频 电 路 。 

1. 5 倍 分 频 的 查找 表 实 现 

通过 图 4.7 所 示 的 3 分 频 电路 产生 1. 5 倍 分 频 。 在 图 4.7 中 两 个 触发 
器 组 成 了 3 分 频 电 路 〈 非 50% 占 空 比 ) 5 。 
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图 4.7 1.5 售 分 频 ( 非 50% 占 空 比 ) 
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第 5 章 
低 功 耗 设 计 


5.2 功 耗 源 


在 早期 的 IC 设计 中 ， 功 耗 并 不 是 一 个 重要 的 约束 条 件 ， 所 以 在 设计 
时 往往 不 对 其 作 以 考虑 。 随 着 使 用 电池 供电 的 器 件 变 得 更 小 ， 功 能 更 多 ， 
对 功 耗 的 要 求 也 越 来 越 高 。 

虽然 对 于 在 使 用 电池 的 应 用 中 ， 如 起 捕 器 和 数字 电子 表 ， 低 功 耗 设计 
技术 已 经 使 用 了 很 多 年 ， 但 如 今 的 技术 趋势 使 得 这 些 技术 得 以 更 广泛 地 
使 用 。 

能 量 以 热量 形式 消耗 。 对 于 设备 制造 商 ， 发 热管 理 仍然 是 一 个 主要 的 
考虑 因素 。 可 靠 性 是 温度 的 函数 ， 据 估计 温度 每 升 高 10°C 失效 率 可 能 提 
高 一 倍 。 保 持 低温 操作 环境 意味 着 使 用 散热 片 或 风扇 来 散热 一 “这 会 增加 
整体 的 重量 和 成 本 。 如 果 能 在 SoC 级 对 功 耗 进行 控制 ， 就 可 以 减少 甚至 可 
能 消除 掉 这 些 开 支 ， 也 就 可 以 得 到 更 小 、 更 便宜 和 更 可 靠 的 最 终 产品 。 

近来 对 于 能 源 效率 目标 的 关注 达到 了 前 所 未 有 的 高 度 。 本 章 描述 了 减 
少 动态 和 静态 功 耗 的 各 种 技术 。 


浪 涌 、 静 态 功 耗 和 动态 功 耗 是 三 个 主要 的 功 耗 源 。 浪 涌 电 流 指 器 件 上 
电 时 产生 的 最 大 瞬时 输入 电流 。 浪 涌 电 流 在 应 用 中 也 称 为 启动 电流 。 


5.3 在 各 设计 抽象 层次 降低 功 耗 # 91 


浪 涌 电 流 与 设备 相关 。 如 电机 的 启动 电流 在 前 几 个 周期 中 是 正常 满载 
电流 的 数 倍 。 

基于 SRAM 的 FPGA 也 有 很 突出 的 浪 涌 电流 ， 因 为 上 电 时 这 些 器 件 
没有 配置 ， 所 以 需要 从 外 部 存储 器 中 下 载 数据 来 配置 其 编程 资源 ， 如 布 
线 连接 和 查找 表 。 反 之 ， 反 熔 丝 FPGA 由 于 无 须 上 电 配 置 ， 所 以 没有 浪 
涌 电 流 。 

待机 电流 指 在 关 断 主 电 源 或 系统 进入 待机 模式 下 产生 的 电流 。 由 待机 
电流 产生 的 功 耗 称 为 待机 功 耗 。 与 浪 涌 功 耗 极为 类 似 ， 待 机 功 耗 与 元 件 的 
电气 特征 密切 相关 。 待 机 功 耗 也 称 为 静态 功 耗 。 需 要 指出 的 是 ， 项 态 功 耗 
也 包含 电路 中 由 晶体 管 的 漏电 流 所 导致 的 功 耗 。 

动态 功 耗 或 开关 功 耗 是 门 电路 输出 切换 时 ， 由 逻辑 转换 所 引起 的 
功 耗 。 

功 态 功 耗 (Paswwwc) 由 下 面 的 等 式 定义 : 
2 dynamic 二 SCL Vg for 
式 中 Ci = 门 寄生 电容 

S = 每 个 时 钟 通过 整个 电路 的 平均 转换 次 数 

fa = 时 钟 频率 

Vw = 供电 电压 

输出 从 逻辑 0 变 为 逻辑 1， 电 容 充 电 ， 从 逻辑 1 到 逻辑 0， 电容 放 电 。 
注意 ， 开 关 功 耗 也 是 时 钟 频率 .如 和 供电 电压 Vaw 的 函数 。 

因此 ，ASIC 的 总 功 耗 定义 为 : 

Ba EE Dama Hla 

对 若干 时 钟 周期 使 用 这 些 方程 ， 就 得 到 了 平均 功 耗 。 

功 态 功 耗 在 大 规模 IC 设计 中 占 主要 地 位 。 在 典型 的 应 用 中 动态 功 耗 
占 到 了 总 功 耗 的 80% 。 


5. 3 在 各 设计 抽象 层次 降低 功 耗 


降低 功 耗 应 当 在 所 有 设计 层次 上 进行 。 即 ， 在 系统 级 、 逮 辑 级 和 物理 
级 。 层 次 越 高 对 功 耗 降低 就 可 能 越 有 效 。 

图 5. 1 展示 了 在 不 同 设计 层次 上 降低 功 耗 的 各 种 设计 技术 。 虽 然 功 耗 
可 以 在 各 设计 层次 降低 ， 但 是 最 好 在 更 高 的 抽象 层次 上 进行 ， 即 ， 在 系统 
和 体系 结构 级 可 以 达到 最 大 的 降低 效果 。 
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系统 级 
体系 结构 级 
狼 热 “one 行 波 计数 器 。 总线 反 转 窜 存 尖 竺 输 级 + 
hot) 编码 ”避免 组 合 环 路 。 ”减少 字 长 逻辑 / 门 级 
二 进 制 表示 法 。 ”去 掉 逻 辑 云 其 他 RIL 技术 
晶体 管 级 


图 5.1 各 抽象 层次 降 功 耗 图 


为 了 最 大 程度 降低 功 耗 ， 各 抽象 层次 在 设计 时 就 要 把 功 耗 因素 考虑 
在 内 。 

再 次 回 到 前 面 对 整 体 功 耗 描述 的 方程 上 ， 可 以 看 出 可 以 通过 降低 电 
压 、 电 容 、 信 和 号 频率 和 单元 能 耗 来 降低 整体 功 耗 。 在 特定 的 层次 上 ， 指 定 
技术 会 涉及 这 些 因素 中 的 一 个 或 多 个 。 

许多 系统 级 的 设计 决定 与 应 用 密切 相关 ， 即 ， 是 选择 基于 缓存 的 存储 
器 还 是 集中 式 存储 器 。 在 体系 结构 级 往往 需要 选择 使 用 并 行 结构 还 是 流水 
线 结构 ， 并 行 结构 比 多 路 复 用 的 方式 能 效 更 高 。 在 逻辑 和 版 图 级 ， 对 映射 
网 表 方法 的 选择 和 低 功 耗 库 的 选择 是 关键 。 在 物理 级 ， 要 使 用 版 图 优化 
技术 。 

表 5. 1 展示 了 各 抽象 设计 层次 中 对 功 耗 降低 程度 的 影响 。 


表 5. 1 不 同 层次 的 功 耗 降低 比率 


抽象 级 功 耗 降低 几率 
系统 级 10% ~100% 
体系 结构 级 10% ~90% 
寄存 器 传输 级 15% ~50% 
逻辑 / 门 级 15% ~20% 
晶体 管 级 2% ~10% 


下 面 几 节 介绍 了 在 从 系统 到 晶体 管 级 之 间 的 各 层次 上 所 使 用 的 各 种 低 
功 耗 技术 。 
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5.4 ”系统 级 低 功 耗 技术 


在 系统 设计 之 前 ， 必 须 对 系统 及 其 性 能 以 及 功 耗 的 目标 作 以 考虑 。 


5.4.1 片上 系统 方法 


对 于 纳米 级 高 端 蕊 片 ， 由 于 0 使 用 比 芯 片 内 核 逻 辑 更 高 的 电压 供电 
(典型 值 为 3.3V) ， 使 得 其 占 到 总 功 耗 的 50% 以 上 。 如 果 整 个 系统 包含 多 
块 芯 片 ， 这 些 芯 片 间 的 连 线 将 消耗 大 量 的 功 耗 。 在 现代 数字 设计 实践 中 ， 
片上 系统 方法 学 主要 关注 降低 功 耗 ， 缩 减 面积 以 及 降低 成 本 的 手段 。 


5.4.2 硬件 /软件 划分 


由 于 骨 入 式 处 理 器 在 大 规模 数字 系统 中 广泛 使 用 ， 因 此 某 些 功能 可 以 
用 硬件 实现 ， 其 余部 分 可 以 用 软件 实现 。 

通信 算法 具有 高 度 递 归 的 性 质 ， 这 意味 着 少量 的 代码 就 可 以 负责 大 量 
的 处 理 任 务 。 事 实 上 10% 的 代码 花费 了 90% 的 执行 时 间 。 如 果 这 些 资源 密 
集 型 模块 能 用 硬件 标识 和 实现 ， 就 能 节约 大 量 功 耗 。 这 种 递归 模块 可 能 只 
占 整 体系 统 很 小 的 一 部 分 ， 但 能 显著 地 降低 功 耗 。 

文献 [10] 的 作者 发 布 了 色 键 算法 ， 用 22 000 行 代 码 实现 。 其 中 只 有 
15 行 关键 的 循环 部 分 用 硬件 实现 ,但 降低 了 77% 的 功 耗 。 

协同 设计 的 常规 技术 是 在 设计 的 早期 将 系统 划分 为 硬件 和 软件 部 分 并 
反复 优化 以 得 到 最 佳 方案 。 这 种 方法 代价 较 高 并 比较 费时 。 

典型 的 设计 流程 在 文献 [11] 中 进行 了 介绍 : 

。 性 能 规范 

。 划分 

。 综合 

。 集成 
协同 设计 
。 验证 
图 5. 2 为 硬 软 件 协 同 设计 的 常规 方法 。 
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peso ooss olsonacncdic 和 cdi 





HW/SW 集 成 和 
协同 仿真 


图 5.2 硬 / 软 件 协同 设计 的 常规 方法 





系统 的 设计 过 程 从 性 能 规范 开始 。 系 统 设计 者 根据 规范 和 自身 经 验 对 
系统 性 能 作出 推测 。 根 据 推测 来 决定 系统 哪些 部 分 用 硬件 实现 (以 ASIC 
的 形式 ) ， 哪 些 部 分 用 软件 实现 。 

这 也 涉及 对 系统 不 同 部 分 的 行为 进行 描述 。 例 如 ， 硬 件 部 分 可 以 用 
VHDL 或 Verilog 语言 进行 描述 ， 软 件 部 分 用 C 语言 进 描述 。 此 外 ， 接 口 逻 
辑 (包括 任意 信号 交换 或 总 线 逻 辑 ) 也 需要 明确 下 来 。 

可 以 使 用 不 同 的 工具 从 行为 模式 中 提取 出 物理 模型 ， 比 如 ， 使 用 硬件 
综合 工具 从 用 Verilog 或 VHDL 描述 的 模块 中 提取 出 物理 模型 。 与 之 类 似 ， 
编译 器 也 可 以 将 用 高 级 语言 编写 的 程序 编译 为 姐 信 式 处 理 器 所 使 用 的 原生 
指令 集 。 

下 一 步 是 使 用 商业 级 协同 仿真 平台 对 在 集成 环境 下 已 综合 的 硬件 和 软 
件 模 型 进行 协同 仿真 。 协 同 仿真 用 于 验证 设计 功能 的 要 求 和 规范 的 约束 。 
如 果 系 统 不 满足 要 求 ， 整 个 过 程 要 从 系统 划分 开始 重新 再 来 。 

一 种 比 常规 方式 更 有 效 的 HW/SW 划分 方法 是 使 用 基于 模型 的 方式 ， 
如 图 5.3 所 示 。 

这 是 一 种 基于 给 定 规范 建立 系统 模型 的 想法 。 模 型 要 么 完全 自己 建 
立 要 么 使 用 可 复 用 的 已 有 模型 库 。 随 着 库 的 增加 ， 可 以 大 大 缩短 设计 
时 间 。 


5.4 系统 级 低 功 耗 技术 9 95 





图 5.3 用 基于 模型 的 方法 进行 HW/SW 协同 设计 


可 以 使 用 SystemC 建立 模型 这 种 语言 是 C++ 语言 的 一 组 系统 扩展 
库 ， 用 于 对 硬件 建 模 。SystemC 程序 可 以 用 标准 C++ 编译 器 编译 并 产生 用 
于 仿真 的 目标 代码 。 

SystemC 可 以 很 灵活 地 创建 精确 到 周期 的 高 抽象 级 模型 来 描述 整个 
系统 。 

仿真 的 结果 用 来 验证 模型 。 将 仿真 输出 与 期 望 值 进行 比较 。 验 证 的 结 
果 也 可 以 用 来 完善 模型 。 

系统 级 建 模 和 HW/SW 划分 的 详细 说 明 不 在 本 书 的 描述 范围 之 内 。 


5.4.3 低 功 耗 软 件 


硬件 设计 人 员 在 设计 集成 世 片 或 ASIC 时 往往 会 考虑 功 耗 因素 。 但 大 
多 数 软件 工程 师 并 不 会 这 样 做 。 另 外 ， 通 过 修改 应 用 软件 可 以 大 量 降 低 功 
耗 ， 得 到 “更 加 绿色 ”和 能 效 更 高 的 系统 。 

高 级 语言 便于 使 用 并 可 以 事半功倍 。 然 而 ， 有 些 结构 难以 用 其 实现 ， 
而 且 实 现 高 级 语言 的 运行 时 环境 使 用 高 频 轮 询 来 实现 这 样 的 结构 ， 这 会 导 
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致 较 高 的 能 耗 。 所 以 在 使 用 高 级 语言 时 要 避免 使 用 复杂 原 语 。 

对 于 肉 入 式 应 用 ， 常 常 在 设计 中 使 用 现 有 的 工业 级 C 代码 。C 代码 可 
能 会 使 用 若干 循环 。 在 一 些 应 用 中 ，90% 的 运 时 时 间 可 能 都 在 执行 这 些 
循环 。 

可 以 使 用 几 种 技术 来 优化 这 些 循 环 。 如 果 两 个 循环 在 同样 的 索引 下 逐 
一 执行 ， 可 以 将 它们 合并 。 执 行 的 指令 数 由 此 减少 。 例 如 ， 按 下 面 所 示 的 
方式 将 循环 合并 后 ， 由 于 移 除 了 循环 计数 器 〈 初 始 化 、 递 增 和 比较 ) ,使 
循环 指令 数目 减少 了 。 





其 他 的 考虑 可 能 包括 基于 确定 硬件 体系 结构 或 处 理 器 指令 和 寄存 器 的 
实现 。 需 要 注意 的 是 ， 基 于 uP 的 实现 会 产生 高 序列 ， 因 为 内 部 寄存 器 
(ALU 加 法 器 ) 可 以 用 来 快速 地 进行 这 些 操 作 。 例 如 ， 可 能 只 需 一 步 就 可 
以 更 新 硬件 计数 器 ， 而 在 后 面 将 提 到 在 软件 中 实现 同样 的 操作 需要 许多 时 
钟 周期 来 顺序 执行 若干 条 指令 。 


5.4.4 选择 处 理 器 


处 理 器 的 选择 会 对 整体 功 耗 产生 明显 影响 。 第 一 点 是 采用 适合 所 要 求 
的 数据 宽度 的 处 理 器 。 使 用 8 位 微 控制 器 来 处 理 16 位 数据 将 会 增加 大 量 排 
序 。 对 16 位 乘法 ,使 用 16 位 处 理 器 需要 30 条 指令 (加 - 移 位 算法 ) ， 而 
在 8 位 器 机 上 则 需要 127 条 指令 〈 双 精度 ) 。 更 好 的 结构 是 使 乘 加 单元 
(MAC) 或 16 x16 位 并 行 乘法 器 用 一 条 指令 来 执行 乘法 。 

如 果 用 简单 的 MAC 就 能 满足 运算 要 求 ， 就 没有 必要 使 用 专用 DSP 处 
理 器 来 处 理 数 据 ， 这 样 能 显著 降低 功 耗 。 

图 5. 4 中 是 一 个 有 趣 的 节省 功 耗 的 系统 体系 结构 5 。 对 于 任何 应 用 ， 
都 利用 微 处 理 器 进行 控制 ， 同 时 用 协 处 理 器 或 DSP 进行 数据 处 理 。 最 好 的 
系统 体系 结构 是 使 用 特定 的 机 器 〈 协 处 理 器 ) 来 执行 这 个 任务 ， 以 使 任务 
在 最 小 且 能 效 最 高 的 机 器 中 完成 。 大 多 数 情况 下 ， 微 控制 器 和 协 处 理 器 不 
会 并 行 运行 。 


5.5 体系 结构 级 降低 功 耗 技术 * 97 





内 部 RAM 


图 5.4 微 控 制 器 和 协同 处 理 器 


5.5 体系 结构 级 降低 功 耗 技 术 


系统 使 用 不 同 的 体系 结构 对 于 功 耗 会 有 显著 的 影响 。 本 节 介 绍 一 些 体 
系 结构 级 的 权衡 和 技术 以 减少 功 耗 。 


5.5.1 高 级 门 控 时 钟 


在 同步 数字 系统 中 ， 时 钟 分 布 贡献 了 整个 数字 开关 功率 中 的 绝 大 部 
分 。 在 许多 情况 可 以 通过 门 控 时 钟 将 绝 大 部 分 不 使 用 的 电路 关闭 掉 。 

组 合 门 控 时 钟 已 经 在 2.5 节 中 介绍 过 。 组 合 门 控 时 钟 基于 从 寄存 器 的 
输出 到 输入 之 间 存 在 着 反馈 回路 这 样 的 事实 ， 所 以 也 称 为 “基于 反馈 回路 
的 门 控 时 钟 "。 注 意 ， 在 组 合 门 控 时 钟 中 ， 在 插入 门 控 时 钟 之 前 和 插入 之 
后 电路 的 功能 并 没有 改变 ， 所 以 可 以 用 一 致 性 检查 工具 进行 验证 。 在 本 节 
中 我 们 会 接触 到 一 些 高 级 的 门 控 时 钟 技 术 。 

因为 组 合 门 控 时 钟 方案 在 输出 不 变 时 使 触发 器 的 时 钟 失效 ， 所 以 它 可 
以 降低 5% ~10% 的 动态 功 耗 。 反 之 ， 时 序 门 控 时 钟 在 不 影响 设计 功能 的 
情况 下 改变 设计 结构 。 时 序 门 控 时 钟 能 减少 连接 到 带 有 门 控 时 钟 的 寄存 器 
块 的 设计 部 分 的 元 余 切换 。 

图 5. 5 为 组 合 门 控 时 钟 示意 图 ， 图 5. 6 为 同样 电路 的 时 序 门 控 时 钟 示 
意图 。 注 意 ， 在 使 用 时 序 门 控 时 钟 时 ， 后 序 的 流水 线 阶 段 也 使 用 同样 的 条 
件 进行 门 控 操作 。 

在 图 5. 6 中 可 以 看 到 时 序 门 控 时 钟 在 实现 会 加 入 额外 的 逻辑 。 因 为 需 
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要 这 样 多 余 的 逻辑 ， 所 以 该 技术 并 不 适用 于 多 位 宽 数据 的 情况 。 





图 5.6 时 序 门 控 时 钟 


使 用 时 序 门 控 时 钟 最 大 的 挑战 在 于 识别 出 流水 线 上 “多 余 的 ”或 “不 
关心 ”的 状态 ,一 旦 这 一 工作 完成 ， 使 用 时 序 门 控 时 钟 就 可 以 降低 大 量 功 
耗 ， 典 型 情况 下 可 以 降低 15% ~25% 的 开关 次 数 '“ 。 
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按照 文献 [14] ， 时 序 门 控 时 钟 转换 只 在 有 多 于 16 个 触发 器 的 情况 下 
才 更 有 效率 。 


5. 5.2 动态 电压 频率 调节 


动态 电压 频率 调节 (Dynamic Voltage/Frequency Scaling，DVFS) 是 提 
高 系统 能 效 的 流行 方法 。 在 对 频率 不 敏感 的 应 用 阶段 中 降低 时 钟 速率 和 供 
电 电压 ， 可 以 在 性 能 适度 损失 的 情况 下 大 幅 降低 功 耗 。 

5. 2 节 提 到 ， 功 耗 正 比 于 供电 电压 的 平方 。 因 此 减少 供电 电压 将 会 使 
功 耗 相应 降低 四 分 之 一 。 但 是 降低 供电 电压 也 会 降低 系统 的 性 能 ， 所 以 需 
要 作出 权衡 。 

对 于 像 移动 手机 、PDA 这 样 的 手持 设备 ,在 设计 目标 上 存在 着 固有 的 
冲突 ， 即 它们 应 当 能 使 电池 使 用 时 间 尽 可 能 长 ,但 是 作为 智能 设备 又 需要 
性 能 强大 的 处 理 器 ， 这 将 比 简单 设备 消耗 更 多 的 能 量 ， 从 而 减少 电池 使 用 
时 间 。 尽 管 随 着 半导体 技术 和 电池 技术 的 发 展 ， 使 得 微 处 理 器 在 单位 能 耗 
下 能 提供 更 强大 的 运算 能 力 ， 但 是 在 性 能 和 电池 寿命 方面 进行 基本 的 权衡 
仍然 非常 关键 。 

对 于 典型 应 用 ， 一 般 只 在 很 小 的 时 间 比 例 中 需要 高 性 能 ， 而 在 其 余 的 
大 多 数 时 间 里 使 用 低 性 能 、 低 功 耗 的 处 理 器 就 足够 了 。 在 处 理 器 不 需要 全 
速 运行 时 ， 可 以 简单 地 通过 降低 其 频率 来 达到 这 个 目的 。 

当今 使 用 CMOS 工艺 的 绝 大 多 数 处 理 器 的 最 大 频率 往往 与 供电 电压 相 
关 ， 所 以 在 低频 时 处 理 器 可 以 工作 在 低 供电 电压 下 。 因 此 ，DVFS 可 以 通 
过 频率 和 电压 调节 节省 大 量 能 量 。 

在 实时 艇 入 式 系 统 中 ， 往 往 不 能 直接 使 用 目前 已 知 的 DVFS 算法 ， 因 
为 改变 处 理 器 的 操作 电压 将 会 影响 到 任务 的 执行 时 间 并 违反 时 效 性 要 求 。 

有 些 DVFS 能 合并 到 0S 调度 程序 和 实时 嵌入 式 系 统 任务 管 理 服务 中 ， 
这 样 既 能 通过 DVFS 节省 功 耗 ， 又 能 保证 对 时 效 性 的 要 求 。 

特别 是 ， 动 态 电压 调节 (Dynamic Voltage Scaling，DVS) 依赖 特殊 的 
硬件 ， 而 使 用 一 个 可 编程 的 DC-DC 开关 电压 调节 器 ， 一 个 可 编程 的 时 钟 产 
生 器 和 一 个 宽 操 作 域 的 高 性 能 处 理 器 提供 了 两 全 其 美的 方式 。 在 需要 峰值 
计算 载荷 时 ， 处 理 器 在 正常 电压 和 频率 下 操作 。 当 负载 降低 ， 在 能 满足 对 
运算 能 力 的 要 求 的 条 件 下 频率 也 降低 。 

随 着 技术 的 进步 ， 现 在 设计 者 可 以 将 越 来 越 多 的 核 集成 到 单 芯片 上 。 
微 处 理 器 设计 现在 已 经 从 对 全 芯片 电压 /频率 控制 转变 为 更 细 粒 度 的 方式 ， 
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从 而 增加 了 能 效 。 例 如 ，AMD 的 四 核 嵌 龙 处 理 器 允许 对 所 有 四 核 进行 独立 
频率 控制 ， 共 享 的 13 缓存 和 片上 北桥 ，DDR 接口 和 四 个 超 传 输 链接 " 。 

总 之 ， 通 过 根据 运算 负载 动态 调整 处 理 器 /系统 的 电压 和 频率 ，DVS 
能 提供 峰值 满足 运算 要 求 的 性 能 ， 通 常 这 种 方式 降低 功 耗 〈 包 括 每 单元 计 
算 的 能 量 ) 所 带 来 的 好 处 能 体现 在 低 性 能 处 理 器 上 。 


5. 5. 3 基于 缓存 的 系统 体系 结构 


对 大 多 数 DSP 应用， 快速 健 里 叶 变 换 (Fast Fourier Transform,，FFT) 
算法 要 求 频繁 访问 系统 存储 器 的 数据 ， 而 这 样 的 存储 器 能 效 并 不 高 。 增 强 
型 FFT 体系 结构 需要 在 系统 存储 器 或 RAM 和 处 理 器 之 间 增 加 缓存 。 

这 种 方案 的 最 初 目的 是 在 处 理 器 需要 之 前 ， 预 先 将 相关 数据 从 主 存 中 
取 到 缓存 中 。 使 用 小 范围 的 缓存 能 使 计算 能 耗 大 量 下 降 ， 极 大 地 提高 了 
FFT 的 能 效 。 


5.5.4 对 数 FFT 体系 结构 


对 于 要 大 规模 运算 的 应 用 ， 使 用 对 数 系统 (Logarithmic Number Sys- 
tem，LNS) 比 使 用 线性 系统 更 好 。LNS 在 降低 平均 位 元 活跃 度 的 同时 用 加 
法 和 减法 实现 乘除 运算 ,使 其 效率 比 线性 系统 更 高 。 因 此 基于 LNS 实现 
FFT 可 能 节省 大 量 功 耗 。 负 面 影响 是 加 法 器 和 减法 器 的 宽度 会 增加 一 一 导 
致 需要 以 指数 级 增 大 的 查找 表 。 


5.5.5 异步 (无 时 钟 ) 设计 


对 于 基于 时 钟 体系 结构 的 同步 时 钟 设计 ( 见 图 5.7) 来 说 ， 时 钟 分 布 
消耗 掉 了 大 部 分 的 能 量 。 传 统 的 设计 方法 学 会 形成 大 规模 时 钟 树 结构 ， 这 
样 便 潜在 地 增加 了 SoC 的 平均 功 耗 。 时 钟 分 配 网 络 的 设计 也 耗费 了 设计 者 
的 大 量 精力 。 最 可 能 存在 的 问题 的 是 时 钟 偏 移 ， 即 时 到 达 电 路 不 同 部 分 的 
时 间 的 差异 。 当 电路 规模 较 大 并 较 慢 时 ， 时 钟 偏 移 无 关 紧要 。 但 是 随 着 电 
路 工艺 缩小 和 速度 增加 ， 时 钟 偏 移 的 差异 就 会 变 得 更 加 明显 ， 需 要 额外 的 
设计 时 间 和 电路 来 解决 这 个 问题 。 将 时 钟 分 布 到 整个 芯片 上 并 不 是 一 件 容 
易 的 事 ， 而 且 可 能 会 产生 不 规则 的 版 图 。 此 外 存在 的 另 一 个 问题 就 是 相当 
大 的 功 耗 。 
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同步 系统 
(集中 式 时 钟 ) 


图 5.7 集中 式 时 钟 的 同步 系统 


由 于 时 钟 会 导致 以 上 一 系列 问题 ， 将 其 从 设计 中 移 除 是 一 件 很 有 诱惑 
力 的 想法 。 这 就 是 异步 设计 的 基本 意图 。 然 而 ， 并 不 能 简单 地 直接 移 除 时 
钟 ， 因 为 仍 需 要 对 电路 操作 进行 某 种 控制 。 异 步 电路 本 质 上 进行 自我 控 
制 ， 因 此 也 称 为 自 定 时 电路 。 

图 5. 8 中 是 一 个 异步 系统 ， 其 中 两 个 模块 使 用 握手 接口 进行 交互 。 


同步 系统 
〈 集 中式 时 钟 ) 


图 5.8 基于 握手 接口 的 异步 系统 (无 全 局 时 钟 ) 


移 除 时 钟 使 得 能 效 提升 。 时 钟 耗 费 了 许多 能 量 ， 特 别 在 大 规模 高 速 系 
统 中 ， 所 以 将 其 移 除 使 得 能 效 大 大 提高 。 除 此 之 外 ， 因 为 未 工作 元 件 几乎 
不 消耗 能 量 ， 所 以 异步 电路 的 动态 功 耗 接近 于 0。 

异步 电路 基于 依赖 延迟 不 敏感 编码 (delay in- sensitive encoding) 的 信 
号 交换 接口 ， 其 中 最 流行 的 是 双轨 道 编码 。 

双轨 道 编码 用 两 根 线 传 输 每 个 数据 位 ， 因 此 称 为 双轨 。 (单轨 只 使 用 
一 根 线 传输 每 个 数据 位 。) 
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在 双轨 道 编码 中 ， 一 根 线 用 于 表示 逻辑 1， 另 一 根 表示 逻辑 0。 两 部 分 
能 可 靠 地 彼此 通信 而 不 受 线 上 延迟 的 影响 。 这 种 协议 对 延迟 是 不 敏感 的 。 
编码 方式 如 下 : 

“LL”=“ 无 数据 ”，“LH”=“0”,， “HL”=“1” 这 里 L= 妇 辑 “0” 且 
Hs 如 名 1 

这 里 0 或 1 表示 有 效 数据 。“11” 表 示 无 效 。 

注意 ， 这 里 n 位 数据 通信 和 需要 2n 条 线 ， 每 位 都 是 自 定时 的 。 

本 节 所 描述 的 编码 方式 是 四 相 双 轨道 编码 。 双 相 双 轨道 编码 也 使 用 两 
根 线 表示 1 位 数据 ,但 是 信息 按 事件 进行 编程 (0 到 1，1 到 0)。 在 一 根 
线 进行 传输 时 ， 接 收 新 的 码 字 。 不 存在 空 值 ( 即 没有 “00”) 。 一 条 有 效 消 
息 应 答 后 紧 随 另 一 条 有 效 消息 。 

也 有 其 他 对 延迟 不 敏感 的 编码 和 基于 事件 的 信号 ， 应 基于 引 脚 和 能 效 
进行 选择 。 

按照 《国际 半导体 技术 路 线 图 》(ITRS，ex. SIA) ，1999 版 : 

随 着 时 钟 速度 很 可 能 超过 5GHz， 并 且 片 间 通 信 开 支 占 用 5 ~20 个 时 钟 
周期 ， 需 要 一 种 建立 层次 化 时 钟 速度 的 方法 ， 实 现 本 地 同步 和 全 局 异步 连 
接 。 这 需要 既 能 处 理 异 步 、 多 周期 互 连 又 能 处 理 本 地 同步 、 邻 近 高 性 能 通 
信 的 工具 。 


异步 电路 的 进一步 细节 已 经 超出 了 本 书 的 范围 。 


5.5.6 电源 门 控 


与 电压 门 控 类 似 ， 电 源 门 控 可 以 在 模块 不 使 用 时 暂时 将 其 关闭 。 

对 于 使 用 90nm 以 下 工艺 设计 的 器 件 ， 晶 体 管 漏电 流 以 指数 程度 增长 ， 
这 使 得 设计 满足 预期 的 功 耗 目 标 成 为 一 个 挑战 。 减 少 过 度 漏电 以 保证 电池 
寿命 很 重要 ， 尤 其 对 于 使 用 电池 的 手持 设备 。 电 源 门 控 是 解决 这 个 复杂 挑 
战 最 有 效 的 技术 ， 它 可 在 逻辑 模块 不 操作 时 将 其 关闭 。 

电源 门 控 (或 电源 切断 技术 ) 通常 指 在 芯片 上 加 入 开关 以 根据 应 用 要 
求 选择 性 切断 供电 电流 。 设 计 者 可 使 用 两 类 电源 门 控 : 细 粒 度 电源 门 控 和 
粗 粒 度 电 源 门 控 。 


5. 5.6.1 细 粒 度 电 源 门 控 
在 细 粒 度 电 源 门 控 中 ， 在 每 个 门 和 地 之 间 存 在 一 个 开关 晶体 管 。 这 种 
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方式 允许 在 不 使 用 某 些 功能 时 关闭 与 地 的 连接 。 可 以 对 库 中 的 每 个 元 件 进 
行 这 种 控制 。 

添加 开关 晶体 管 所 引起 的 主要 负担 增加 在 库 卫 提供 者 或 标准 单元 设计 
者 身上 "9 。 通 常 这 些 元 件 的 设计 遵循 普通 标准 单元 规则 并 能 被 EDA 工具 
用 于 实现 。 

电源 门 控 的 尺寸 必须 能 满足 任何 情况 下 对 开关 电流 的 需求 。 这 种 门 必 
须 较 大 以 便 不 会 引起 可 测量 的 压 降 ( 芒 )。 此 外 对 头 部 开关 〈P-MOS) 和 
脚 部 开关 (N-MOS) 也 要 作出 选择 ， 如 图 5.9 所 示 。 通 常 在 所 提供 的 开关 
电流 相同 时 ， 脚 部 开关 的 面积 更 小 。 动 态 功 耗 分 析 工 具 能 精确 地 测量 开关 
电流 ， 并 能 预测 电源 门 控 的 尺寸 。 





图 5.9 头 部 和 脚 部 电源 门 控 


使 用 细 粒 度 电源 门 控 是 一 门 优雅 的 艺术 ， 可 以 将 漏电 减少 为 原来 的 
IlX1059 。 在 仅仅 使 用 多 电压 优化 方法 不 能 满足 功 耗 要 求 的 情况 下 ， 这 种 降 
低 功 耗 的 方法 是 一 种 很 有 吸引 力 的 技术 。 


5. 5. 6.2 粗 粒 度 电 源 门 控 


在 粗 粒 度 电源 门 控 中 ， 电 源 门 控 晶 体 管 是 供电 网 络 的 一 部 分 而 不 是 标 
准 单 元 的 一 部 分 。 粗 粒度 本 质 上 创建 一 个 电源 开关 网 络 ， 各 组 开关 晶体 管 
能 并 行 地 将 整个 模块 打开 或 关闭 ， 如 图 5. 10 所 示 。 

与 细 粒 度 电 源 门 控 不 同 ， 粗 粒度 方式 不 完全 依赖 于 库 的 质量 ， 而 EDA 
工具 对 其 处 理 能 力 影 响 更 大 。 

粗 粒 度 电 源 门 控 的 操作 与 细 粒 度 电源 门 控 的 操作 相同 。 然 而 ， 对 该 机 
制 的 实现 和 分 析 是 很 复杂 的 。 置 于 电压 关闭 区 域 的 备用 晶体 管 的 大 小 和 数 
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开关 控制 的 VSS 





图 5.10 粗 粒 度 电源 开关 


目 会 影响 对 该 区 域 的 驱动 能 力 。 这 会 将 会 导致 (电压) 降幅 变化 并 使 
性 能 衰弱 。 当 所 有 的 头 部 开关 同时 再 次 打开 ， 从 VDD 到 VSS 就 会 有 瞬间 
充电 /放电 电流 和 短路 电流 产生 。 该 行为 如 图 5. 11 所 示 。 





Wi wes 


图 5.11 粗 粒度 电源 门 控 的 冲击 电流 


这 种 电流 总 和 称 为 上 电 冲 击 电流 。 对 于 避免 器 件 故 障 和 潜在 的 芯片 失 
效 ， 这 种 电流 是 个 关键 。 这 也 是 粗 粒 度 电 源 门 控 实 现 主要 考虑 的 方面 。 

注意 ,不 管 实现 哪 种 类 型 的 电源 门 控 ， 都 需要 改变 RIL， 以 便 设计 一 
个 电源 控制 器 对 需要 关闭 的 模块 进行 控制 ， 而 且 该 模块 的 供电 电压 需要 加 
以 考虑 。 百 万 门 规模 的 ASIC 很 轻易 就 有 20 个 以 上 的 电源 域 。 在 这 样 大 规 
模 的 设计 中 很 难 控制 使 用 单一 的 细 粒 度 或 粗 粒度 技术 ， 因 此 实际 上 可 能 会 
混合 使 用 这 两 种 技术 。 

为 了 最 小 化 漏电 流 ， 门 控 电 源 晶体 管 常常 使 用 高 冰 值 电压 的 单元 。 粗 
粒度 电源 门 控 通 过 优化 低 开 关 率 的 单元 进一步 增加 了 灵活 性 。 这 些 单 元 也 
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可 以 用 填充 元 件 取 代 来 保证 电源 分 配 网 络 的 完整 性 。 

粗 粒 度 电 源 门 控 技 术 能 极 大 减少 功 耗 。 在 本 书 出 版 时 ， 只 有 高 级 EDA 
工具 能 支持 这 种 方法 。 在 门 单元 大 小 的 选择 、 布 局 布线 、 同 步 开 关 分 析 和 
门 控 信 号 转换 速率 方面 的 比较 涉及 复杂 的 优化 过 程 。 工 具 应 当 能 识别 多 电 
源 域 设计 要 求 ， 以 便 能 在 保证 硅 质量 前 提 下 进行 优化 。 

电源 门 控 也 需要 在 “关闭 ” 域 和 “开启 ” 域 之 间 的 逻辑 或 信号 上 加 
人 隔离 单元 以 保持 设计 完整 性 并 避免 功 耗 损耗 。 当 一 个 模块 断 电 后 ， 它 输 
出 给 另 一 个 仍然 带电 模块 的 信号 就 可 能 变 为 浮动 状态 ， 浮 动 值 可 能 在 靖 值 
电压 内 并 产生 不 期 望 的 电流 。 带 电 模 块 输入 处 的 隔离 单元 将 下 电 模块 输 出 
的 信号 固定 在 1 或 0 值 。 通 常 可 用 简单 的 或 /与 逻辑 作为 输出 隔离 器 件 。 隔 
离 单元 要 么 在 RTL 中 插入 ， 要 人 么 在 指定 参数 和 要 插入 的 模块 后 由 EDA 工 
具 自 动 插入。 现在 的 工具 有 足够 的 能 力 可 以 根据 要 求 将 这 些 单元 插入 合适 
的 层次 。 一 部 分 在 综合 时 插入 ， 其 余 的 在 布局 布线 时 插入 。 


5.5.7 多 阅 值 电压 


多 单元 库 有 助 于 处 理 漏电 和 动态 功 耗 的 问题 。 典 型 的 多 单元 库 包 含 至 
少 两 组 功能 相同 但 阔 值 电压 不 同 的 单元 。 高 冰 值 电压 单元 较 慢 但 是 漏电 较 
少 ; 相反 ， 低 阔 值 电压 单元 更 快 但 是 漏电 较 多 。 

高 阔 值 电压 单元 通常 会 比 低 立 值 电压 单元 降低 50% 的 漏电 ， 并 且 没 有 
任何 如 面积 增加 这 样 的 副作用 。 

另 一 方面 使 用 这 种 技术 会 增加 生产 的 复杂 性 ， 也 会 增加 设计 时 间 。 对 
设计 不 恰当 的 优化 可 能 导致 使 用 更 低 的 Vt 单 元， 因此 使 功 耗 增加 。 

对 于 比较 使 用 各 种 不 同 的 Vt 单元 能 和 否 达到 所 期 望 的 性 能 这 一 过 程 ， 
最 好 在 综合 和 布局 优化 阶段 进行 。 逻 辑 综合 或 优化 过 程 的 门 级 映射 阶段 由 
综合 工具 实现 ， 布 局 优化 由 物理 实现 工具 负责 处 理 。 设 计 者 可 能 根据 设计 
目标 使 用 不 同 的 策略 。 

如 果 最 终 的 设计 目标 是 满足 性 能 ,设计 者 可 以 使 用 低 阔 值 电压 库 进 行 
第 一 遍 综 合 以 达到 最 好 的 性 能 来 满足 对 时 序 的 要 求 。 然 后 对 于 设计 中 不 需 
要 最 高 性 能 或 低 阔 值 电压 的 单元 用 高 阔 值 电压 单元 进行 替换 ， 以 减少 整体 
功 耗 和 设计 的 漏电 流 。 这 是 多 阅 值 设计 技术 最 常见 使 用 的 方法 ， 因 为 大 多 
数 应 用 是 以 满足 时 序 要 求 为 前 提 条 件 的 。 在 综合 时 使 用 低 阔 值 电压 库 速 度 
更 快 ， 并 且 能 得 到 更 小 的 设计 面积 。 综 合 工 具 在 使 用 大 量 高 闵 值 电压 单元 
时 可 能 会 耗费 更 多 的 运行 时 间 并 产生 较 大 面积 的 设计 。 
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然而 ， 如 果 设 计 的 主要 目标 是 功 耗 ， 而 面积 是 其 次 的 ， 在 进行 第 一 遍 
综合 时 使 用 高 阔 值 电压 单元 更 合适 ， 然 后 找 出 关键 路 径 并 用 低 阀 值 电压 单 
元 进行 替换 ， 以 达到 最 终 的 性 能 要 求 。 


5.5.8 多 电压 供电 


从 5. 2 节 中 的 动态 功 耗 方程 中 可 以 看 出 功 耗 与 供电 电压 的 平方 成 正 
比 。 在 多 电压 供电 (MSV) 设计 中 ， 设 计 可 以 分 割 为 独立 的 “电压 岛 ”或 
“电压 域 ” ， 根 据 每 个 区 域 对 时 序 的 要 求 而 使 用 不 同 的 供电 电压 。 

一 种 划分 方式 是 将 对 时 序 要 求 严格 的 模块 置 于 标准 电压 下 操作 ， 对 于 
90nm 工艺 是 1.0V。 对 于 时 序 要 求 不 那么 严格 的 路 径 可 以 安排 到 其 他 区 域 ， 
供电 电压 地 也 可 以 下 降 至 0.8V， 这 部 分 设计 的 动态 功 耗 可 下 降 36% 。 

在 过 去 ， 这 种 方式 为 物理 设计 阶段 增加 了 额外 的 复杂 度 。 设 计 者 通常 
需要 手动 插入 指定 的 转换 单元 ， 称 为 电 平移 位 单元 ， 使 信号 可 以 在 不 同 电 
压 域 之 间 传 输 。 对 于 数 百 万 门 的 ASIC， 可 能 会 有 上 千 个 信和 号 跨 电压 域 传 
输 ， 这 就 增加 了 设计 风险 的 发 生 。 现 在 很 多 EDA 公司 都 能 提供 可 以 自动 插 
人 入 电 平移 位 单元 的 工具 ， 使 这 种 方法 越 来 越 可 行 。 


5. 5.9 存储 器 电源 门 控 


在 典型 的 SoC 中 ，SRAM 消耗 了 总 功 耗 的 1/3 ， 其 余部 分 由 时 钟 树 和 
随机 导 辑 消耗 掉 。 所 以 对 于 好 的 电源 管理 策略 ， 存 储 器 架构 是 个 关键 
因素 。 

最 简单 的 形式 是 在 不 使 用 存储 器 矩阵 时 将 其 关闭 。 需 要 在 功 耗 方面 对 
使 用 单个 大 规模 存储 器 矩阵 或 使 用 多 个 小 存储 器 进行 比较 。 

如 果 SoC 只 需要 一 小 部 分 存储 器 常 开 ， 而 其 余部 分 存储 器 可 以 根据 操 
作 模 式 开关 ， 就 可 以 将 存储 器 分 割 成 多 个 部 分 。 小 部 分 存储 器 处 于 电压 
“ 开 ” 状 态 ， 其 余 大 部 分 存储 器 只 在 执行 密集 型 运算 时 打开 。 

此 外 注意 ， 如 果 将 大 块 存 储 体 划分 为 多 个 小 块 后 ， 读 周期 总 数 仍 是 相 
同 的 ， 但 是 每 个 读 周期 所 消耗 的 功 耗 会 大 大 降低 。 

另外 一 种 技术 称 为 基底 偏 压 存储 器 (body-biasing memory) 。 在 这 种 方 
法 中 ,设计 者 在 不 使 用 存储 体 时 将 其 反 向 偏 置 ， 本 质 上 便 提高 了 阅 值 电压 
并 降低 了 漏电 功 耗 。 
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另 一 种 流行 的 方法 是 使 用 多 模式 给 存储 器 供电 。 在 该 技术 中 ,设计 者 
利用 存储 器 和 几 种 供电 模式 。 许 多 设计 利用 双 功 能 存储 器 ， 以 便 在 处 理 右 
对 存储 器 进行 读 写 操作 时 ， 存 储 体 使 用 全 电压 供电 以 保证 操作 得 以 进行 。 
然而 ， 在 存储 器 不 需要 读 、 写 时 ,处理 器 可 以 编程 降低 其 供电 电压 ,使 之 
仅 能 保持 数据 不 丢失 即 可 。 

还 有 一 种 在 封装 级 降低 存储 器 功 耗 的 方法 是 使 用 堆 秋 式 存储 器 ， 即 将 
存储 器 堆 秋 在 裸 片上 面 。 堆 全 式 存储 器 显著 地 降低 了 互 连 电 容 ， 并 将 存储 
器 功 耗 降低 近 30% 。 至 少 ， 对 于 性 能 关键 型 应 用 ， 需 要 较 大 的 存储 器 带宽 
(如 图 像 、 多 媒体 和 调制 解 调 等 )， 可 以 使 用 将 相关 存储 器 堆 释 式 封装 的 方 
式 ， 而 操作 系统 或 其 他 应 用 则 可 以 置 于 外 部 存储 器 中 。 
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在 大 规模 ASIC 中 , 在 RTL (寄存 器 传输 级 ) 完成 时 至 少 80% 的 功 耗 
已 经 确定 。 后 端 流程 不 能 解决 所 有 功 耗 问题 。 需 要 系统 性 地 直接 从 RTL 中 
或 从 映射 结果 中 寻找 降低 功 耗 的 机 会 。 对 于 有 缺陷 的 设计 后 端 流程 是 无 法 
修复 的 ， 如 果 系 统 架 构 出 了 问题 ， 关 键 路 径 就 无 法 达到 闭合 。 后 端 流程 无 
法 修复 微 架构 ， 微 架构 和 RTL 代码 风格 对 于 动态 与 静态 功 耗 有 极 大 的 
影响 。 

因此 ， 有 效 的 方法 学 要 求 在 综合 前 的 RTL 阶段 中 就 将 与 功 耗 相关 的 所 
有 问题 解决 。 


5. 6. 1 状态 机 编码 和 解码 


在 各 种 状态 机 编码 类 型 中 ， 格 雷 码 是 最 适合 低 功 耗 设计 的 。 

图 5. 12 将 二 进 制 编码 状态 机 与 格雷 码 状态 机 进行 比较 。 对 于 二 进 制 
编码 ,在 状态 转换 过 程 中 可 能 有 多 个 触发 器 发 生 翻 转 ， 例 如 ， 从 状态 
D (“011”) 到 状态 下 (“100”) ， 这 比 在 状态 转换 过 程 中 每 次 只 有 一 个 触 
“发 器 变 化 的 格雷 码 要 消耗 更 多 的 能 量 。 

此 外 以 格雷 码 编码 的 状态 机 也 消除 了 依赖 于 状态 的 组 合 等 式 中 存在 毛 
刺 的 风险 。 

出 于 某 些 原因 ， 如 果 对 状态 机 使 用 了 差异 性 较 大 的 编码 风格 ， 仍 然 可 
以 通过 降低 翻转 为 较 多 状态 的 切换 频率 ， 在 状态 转换 时 降低 功 耗 。 例 如 ， 
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图 5.12 低 功 耗 设计 中 二 进 制 编码 与 格雷 码 的 比较 


对 于 16 位 状态 机 ， 有 256 个 状态 值 ， 其 中 一 般 只 有 一 部 分 会 使 用 到 ， 这 部 
分 中 一 些 状 态 会 比 另 一 些 状 态 在 电路 操作 过 程 中 更 可 能 出 现 。 所 以 ， 如 果 
状态 机 中 有 30% 的 转换 发 生 在 从 状态 “0101” 变 为 “1010”， 有 4 位 发 生 
变化 ， 这 就 导致 4 个 状态 寄存 器 及 其 相关 组 合 逻辑 发 生 了 转变 ; 对 于 从 状 
态 “1010” 变 为 “0100”， 只 有 一 个 状态 位 发 生 了 变化 。 这 样 可 将 寄存 器 
功 耗 降低 10% ， 而 组 合 逻 辑 部 分 可 能 会 降 得 更 多 。 

另 一 种 是 如 文献 [27] 中 的 作法 ， 将 有 限 状 态 机 分 解 以 达到 低 功 耗 效 
果 。 基 本 设想 是 将 有 限 状态 机 (FSM) 的 状态 转换 图 (STG) 分 解 为 两 个 ， 
它们 共同 作用 以 达到 与 原来 状态 机 相同 的 效果 。 这 样 做 之 所 以 能 降低 功 
耗 ， 是 因为 如 果 两 个 子 FSM 之 间 没 有 转换 发 生 ， 那 么 只 有 一 个 子 FSM 需 
要 供给 时 钟 。 

这 项 技术 遵循 标准 分 解 结构 。 根 据 各 状态 之 间 的 高 概率 转换 ， 和 与 其 
他 状态 之 间 的 低 概率 转换 将 状态 划分 为 各 子 集 。 状 态 子 集 组 成 在 大 多 数 情 
况 下 常 开 的 子 FSM。 当 小 的 子 FSM 被 激活 时 ， 可 以 关闭 其 他 较 大 的 
子 FSM。 

最 终 ， 因 为 绝 大 多 数 时 间 内 只 需 给 较 小 且 更 有 效率 的 子 FSM 供给 时 
钟 ， 所 以 降低 了 功 耗 。 


5. 6.2 二 进 制 数 表示 法 


在 大 多 数 应 用 中 ， 用 补 码 来 表示 二 进 制 数 往往 比 有 符号 数 更 常 使 用 。 
然而 ， 对 于 某 些 特殊 应 用 ， 在 切换 过 程 中 有 符号 数 更 有 优势 。 
图 5. 13 中 是 对 “0” 和 “1” 分 别 用 补 码 和 有 符号 数 表 示 的 方法 。 
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补 码 


“0” => 00000000 
“= > 1111111 





图 5.13 二进制 数 的 补 码 和 有 符号 数 表示 法 


对 于 某 些 只 使 用 积分 器 进行 求 和 的 应 用 ， 补 码 表达 法 在 0 到 1 的 转变 
发 生 时 所 有 位 都 会 发 生变 化 (有 和 较 高 的 开关 功 耗 )， 与 之 相 比 有 符号 数 只 
有 两 个 位 发 生 了 变化 。 


5. 6.3 门 控 时 钟 基础 


门 控 时 钟 在 2.5 节 中 已 经 有 所 介绍 ， 这 里 从 RTL 编码 的 角度 对 门 控 时 
钟 问题 加 以 描述 。 

让 我 们 考虑 一 个 32 位 寄存 器 “test_ff”， 在 载 和 使 能 “load_cond” 为 
真 时 会 写 入 32 位 输入 数据 值 ， 否 则 该 寄存 器 的 值 保持 不 变 。 图 5. 14 是 该 
逻辑 的 RTL 代码。 图 5. 15 为 相应 的 电路 实现 。 








load_cond 





be 
TT 


PP 
3 


图 5.15 测试 逻辑 的 逻辑 实现 (反面 例子 ) 
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注意 ,根据 RTL 的 写法 ， 在 clock 线 上 不 能 推出 任何 门 控 时 钟 。 某 些 
后 端 工 具 可 能 会 在 该 层次 之 上 或 者 在 预 扁平 化 之 后 产生 门 控 ,但 是 我 们 不 
应 依赖 于 这 种 方法 。 

图 5.16 中 是 以 另 一 种 风格 编码 的 相同 逻辑 的 范例 ， 以 便 可 以 自动 推 
出 门 控 时 钟 。 


块 B: 





图 5.16 测试 逻辑 的 逻辑 实现 (范例 ) 


用 RIL 这 种 编码 方式 ，HDL 编译 器 可 以 看 到 模块 的 整个 图 景 并 能 识别 
“load_cond” 为 32 个 寄存 器 位 所 共享 。 此 外 后 端 环境 设置 时 也 会 以 加 入 一 
个 门 控 时 钟 〈 集 成 化 的 库 单元 ) 来 取代 32 个 多 路 复 用 器 门 。 集 成 时 钟 单 
元 在 扫描 模式 下 通常 会 旁 路 掉 〈 在 图 5. 16 中 未 显示 ) 。 

对 某 些 综合 过 程 未 能 识别 的 情况 ， 可 以 明确 地 指定 门 控 时 钟 对 所 有 功 
能 进行 动态 控制 。 

与 门 控 时 钟 类 似 ， 门 控 信 号 (在 2.5.3 节 中 描述 ) 和 数据 通路 重组 
(在 2.5.4 节 中 描述 ) 等 都 应 当 在 编写 RTL 时 予以 考虑 以 便 达到 进一步 降 
低 功 耗 的 目的 。 
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5. 6.4 独 热 码 多 路 器 


在 RTL 中 有 许多 推出 多 路 器 的 方法 。“case” 语 句 、“if” 语 句 和 状态 
机 一 般 都 能 实现 这 种 效果 。 表 示 多 路 器 (MUX) 最 常用 的 方法 是 使 用 二 进 
制 编码 ， 如 图 5. 17 所 示 。 





图 5.17 MUX 选择 线路 的 二 进 制 编码 


注意 ， 如 果 MUX 的 每 个 输入 是 多 位 总 线 ， 就 会 产生 明显 的 开关 过 程 ， 
由 此 产生 功 耗 。 

如 果 对 “case” 条 件 进 行 编码 时 按 图 5. 18 中 所 示 的 独 热 编 码 方式 ， 而 
不 是 二 进 制 编码 方式 ， 输 出 就 会 更 快 、 更 稳定 ， 而 且 在 初期 就 能 将 未 选中 

















































































































图 5.18 MUX 选择 线路 的 独 热 编码 
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总 线 掩藏 掉 ， 因 此 实现 了 低 功 耗 效果 。 
一 般 数字 设计 中 都 会 存在 多 路 器 ， 因 此 避免 或 掩蔽 掉 伪 转换 的 发 生 能 


有 效 地 降低 功 耗 。 


5. 6.5 除 掉 多 余 的 转换 


在 没有 设置 默认 状态 的 情况 下 ， 总 线 数据 常常 会 发 生 没 有 意义 的 转 
换 。 如 果 转 换 后 的 数据 未 被 真正 采样 ， 那 么 它 就 是 多 余 的 ， 将 这 样 的 转换 
去 掉 显著 可 以 降低 功 耗 。 

图 5. 19 中 是 含有 多 余 转 换 的 例子 ， 这 个 例子 在 读 人 所 有 输入 信号 时 
消耗 了 能 量 ， 但 是 最 终 的 输出 却 未 使 用 。 


load_op 





load_out 





5. 19 ”元 余 转换 消耗 了 能 量 


注意 ， 如 果 “load_out” 不 会 置 为 有 效 ， 那 么 与 之 相关 的 “load_op” 
也 不 应 置 为 有 效 ， 这 样 可 以 节省 一 部 分 功 耗 。 

图 5. 20 是 将 多 余 的 转换 进行 压缩 的 方案 。 仅 当 “SEL” 为 0 时 才 读 人 
“A” 和 “B”， 而 仅 当 “SEL” 为 1 时 才 读 人 “C” 和 “D”。 

图 5. 21 中 同样 的 同一 数据 输入 到 所 有 目标 模块 中 ， 但 是 只 有 “data_ 
sel” 有 效 的 模块 才 接收 该 数据 。 由 于 规定 “data_sel” 每 次 只 有 一 位 有 效 ， 
而 所 有 四 条 总 线 分 支 上 都 产生 了 数据 切换 ， 这 样 就 导致 了 不 必要 的 功 耗 。 

图 5. 22 是 修改 后 的 逻辑 ， 消 除了 多 余 转 换 。 新 增 了 一 些 逻辑 门 ， 用 
来 取消 未 选择 的 总 线 分 支 的 转换 ， 这 些 逻辑 门 会 增加 一 些 功 耗 但 保证 了 
只 有 最 终 选中 的 目标 才 有 数据 切换 发 生 ， 这 样 就 降低 了 功 耗 。 
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sel_in 






load_out 


图 5.20 压缩 元 余 转 换 以 节省 能 量 


























图 5.21 点 对 多 点 式 总 线 的 元 余 转 换 












































图 5.22 在 点 对 多 点 式 总 线 中 压缩 元 余 转 换 
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5. 6.6 资源 共享 


对 于 涉及 较 多 算术 运算 的 设计 ， 如 果 有 同样 的 操作 在 多 处 使 用 ， 必 须 
避免 相应 的 运算 逻辑 在 多 个 位 置 重 复出 现 。 图 5. 23 是 没有 共享 资源 的 
例子 。 


























图 5. 23 在 逻辑 中 未 使 用 资源 共享 


使 用 重复 逻辑 会 增 大 面积 ， 而 且 增 加 功 耗 。 
图 5.24 显示 了 在 各 分 支 条 件 中 只 使 用 一 个 比较 器 “ = =” 和 算术 比 
较 器 “> ”就 实现 了 上 面 同 样 逻辑 的 功能 。 
































图 5.24 在 逻辑 中 使 用 资源 共享 


5. 6. 7 ”使 用 行 波 计数 器 来 降低 功 耗 | 


2.4.3 节 已 经 讨论 过 行 波 计数 器 的 缺点 和 限制 ,但 在 低 功 耗 设计 中 使 
用 它 会 取得 很 好 的 效果 。 本 节 将 讨论 使 用 行 波 计数 器 所 面 对 的 挑战 以 及 可 
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能 的 解决 方法 ， 以 使 其 更 有 效 地 应 用 在 低 功 耗 设计 中 。 
再 次 参考 2.2. 1 节 中 的 图 组 成 四 位 等 效 计数 器 ， 时 钟 偏 移 的 细节 如 
图 5. 25 所 示 。 








行 波 计数 器 连续 


各 级 之 间 的 偏 移 
相位 延迟 
的 展开 图 

clk | : 

~ a 


图 5. 25 ”四 级 行 波 计数 器 中 的 相位 延迟 


每 个 阶段 都 进行 二 分 频 操作 。 因 为 时 钟 像 波浪 一 样 行进 穿 过 系统 中 各 
寄存 器 ， 所 以 称 为 “ 行 波 计数 器 "。 由 于 每 个 寄存 器 都 存在 传播 延迟 ， 因 
此 较 高 有 效 位 相对 于 较 低 有 效 位 更 晚 发 生变 化 。 

在 时 钟 行进 过 程 中 计数 器 可 能 产生 不 正确 的 值 ( 由 于 毛刺 ) 。 在 最 高 
有 效 位 变化 时 ， 会 产生 最 坏 的 影响 。 

在 图 5. 26 中 是 计数 器 从 “0111” 变 为 “1000” 的 时 序 图 ， 在 这 个 过 
程 中 4 个 位 都 发 生 了 变化 。 在 时 钟 传递 过 程 中 会 出 现 短暂 的 伪 输出 值 。 计 
数 器 电路 会 快速 在 “0111”、“0110”、“0100”、“0000”、“1000” 之 间 变 
化 ， 即 值 为 7、6、4、0， 然后 到 8， 而 不 是 干净 地 从 “0111” 输 出 到 
“000 :5 
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9q3 0 "oo 


图 5. 26 四 级 行 波 计数 器 中 的 相位 延迟 


在 许多 使 用 环境 中 ， 这 种 效应 是 在 可 接受 范围 内 的 ， 因 为 行 波 是 快速 
发 生 的 。 如 果 用 计数 器 的 输出 驱动 发 光 二 极 管 (LED)， 根 本 不 会 有 任何 
影响 。 但 如 果 将 该 信号 用 于 驱动 多 路 选择 器 ， 微 处 理 器 (计算机) 电路 中 
存储 器 的 索引 指针 ， 或 者 任何 其 他 伪 误差 可 能 导致 错误 输出 的 情况 ， 便 是 
无 法 接受 的 。 

行 波 计数 器 对 于 静态 时 序 分 析 是 一 个 巨大 的 挑战 ， 因 为 行 波 计数 器 中 
每 个 阶段 都 产生 了 一 个 新 的 时 钟 域 。 这 就 需要 静态 时 序 分 析 工 具 处 理 更 多 
的 时 钟 域 ， 从 而 会 消耗 更 多 的 时 间 。 

同 理 , 行 波 计数 器 也 会 为 扫描 链 的 插入 增加 难度 。 可 以 在 扫描 模式 下 
使 用 多 路 器 对 这 些 寄存 器 的 时 钟 进行 选择 ， 从 而 使 其 在 扫描 模式 下 处 于 同 
一 个 时 钟 域 中 。 但 是 这 样 会 对 缺陷 覆盖 率 产 生 影响 ， 因 为 新 引起 的 时 钟 多 
路 器 形成 了 一 条 无 法 扫描 到 的 路 径 。 


邮 注 意 
基于 上 面 所 提 到 的 种 种 挑战 ， 数 字 设 计 者 应 该 在 有 限 的 情况 和 严密 的 
控制 下 使 用 这 种 技术 。 


有 一 些 方式 可 以 使 行 波 计数 器 更 可 靠 ， 可 用 性 更 强 。 图 5.27 中 的 电 
路 可 以 使 计数 器 不 再 产生 毛刺 。 

接收 电路 使 用 低 有 效 使 能 输入 信号 ， 只 在 时 钟 为 “ 低 ” 时 才 读 人 4 位 
计数 器 的 值 。 一 旦 时 钟 脉冲 置 “高 ” ， 接 收 电路 就 停止 响应 计数 器 电路 的 
输出 。 因 为 计数 电路 是 正 沿 触发 的 ， 所 有 计数 行为 都 发 生 在 时 钟 从 低 到 高 
的 过 程 中 ， 这 样 就 使 接收 电路 在 计数 器 的 4 位 输出 信号 切换 稳定 之 前 一 直 
处 于 无 效 状态 。 图 5. 28 描述 了 这 种 行为 。 
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图 5.27 行 波 计 数 器 输出 不 含 毛刺 的 转换 





RIFFKKN 一 OA 一 一 一 AKC 





(qg0, ql q2, q3) | 


最 终 答 出 “有效 数 据 ”有 效 数 据 ” 痰 有 效 数 据 ”有 效 数据 ”处 有 效 数据 





图 5.28 不 含 毛刺 的 行 波 计 数 器 的 时 序 图 


直到 时 钟 信号 返回 低 状 态 ， 接 收入 电路 才 会 开启 ， 这 样 可 以 保证 所 有 
行 波 都 处 于 安全 稳定 状态 时 新 计数 值 才 会 读 人 接收 电路 。 这 里 时 钟 信号 的 
“高 ”时 间 是 一 个 关键 参数 : 它 至 少 要 与 计数 器 的 最 大 行 波 周 期 同样 长 。 
否则 ， 时 钟 信号 会 过 早 开启 接收 电路 ， 而 这 时 行 波 过 程 仍 在 进行 中 。 

总 之 ， 行 波 计数 器 能 减少 电路 的 漏电 流 并 降低 电路 的 功 耗 ， 但 是 在 使 
用 时 必须 非常 小 心 。 虽 然 行 波 计数 器 实现 起 来 看 着 很 简单 ， 但 是 会 对 可 测 
性 和 缺陷 覆盖 率 产 生 影 响 ， 所 以 必须 要 在 使 用 这 种 异步 计数 器 方法 前 从 正 
反 两 方面 加 以 权衡 (如 在 本 节 中 所 提 到 的 )。 


5. 6.8 总 线 反 转 


在 当前 数据 和 下 一 个 数据 之 间 的 汉 明 距离 大 于 N/2 (N 是 总 线 宽度 ) 
时 ， 就 将 下 一 个 数据 反 向 后 传输 ， 以 减少 总 线 上 出 现 转换 的 位 数量 ， 这 就 
是 总 线 反 转 编码 。 这 种 技术 对 于 减少 大 容量 总 线 上 的 转换 次 数 很 有 效 。 
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该 总 技术 在 传输 数据 的 同时 也 需要 传输 额外 的 一 个 控制 位 ， 以 表示 所 
传输 的 数据 是 否 是 已 反 转 的 (如 图 5.29 所 示 ) 。 





使 用 总 线 反 转 编码 的 总 线 














图 5.29 总 线 反 转 编码 


如 图 5. 30 中 的 例子 所 示 ， 在 总 线 反 转 后 转换 总 量 的 区 别 是 很 明显 的 。 


转换 次 数 让 
00000000 00000000 |0 
2 00000101 2 00000101 |0 
2 00110101 2 00110101 |0 
411011101 411011101 |0 
4 00101101 400101101 |0 
6 11010001 3 00101110 |1 
8 00001111 3 00001111 |0 
$ 01100010 4 10011101 |1 
$3 01001101 401001101 |0 
4 000006600 4 00000000 |0 
8 1111111]1 1 00000000 |1 
8 00000000 1 00000000 10 
54 次 转换 32 次 转换 


图 5.30 总线 反 转 示例 


5.6.9 高 活跃 度 网 络 


处 理 这 类 设计 的 思路 是 将 活跃 度 较 高 的 网 络 和 活 牙 度 较 低 的 网 络 区 分 
开 来 ， 然 后 将 它们 置 于 逻辑 云 中 尽 可 能 深 的 位 置 。 

图 5. 31 所 示 的 逻辑 去 是 素 … 马 和 了 的 函数 。X,…X, 的 变化 频率 较 
低 ， 而 了 是 高 活跃 度 网 络 。 在 右 图 的 具体 实现 中 ， 把 逻辑 云 复 制 了 一 份 ， 
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一 份 中 假设 了 =0， 另 一 份 中 假设 了 =1， 然 后 根据 工 的 值 决定 选择 使 用 哪 
一 个 。 由 于 针对 一 个 固定 的 了 Y 值 ,通常 这 两 份 新 逻辑 云 的 规模 会 有 所 
减 小 。 





图 5.31 将 高 活跃 度 网 络 与 静态 网 络 分 开 


某 些 降低 功 耗 的 工具 能 给 设计 加 上 驱动 输入 向 量 ,， 然 后 对 活路 的 网 络 
进行 分 析 ， 并 自动 进行 优化 。 


5. 6. 10 ”启用 和 禁用 逻辑 云 


在 操作 大 规模 逻辑 云 (包括 宽 加 法 器 、 乘 法 器 等 ) 时 ， 往 往 会 在 需要 
时 才 将 其 打开 。 

在 图 5. 32a 的 实现 方法 中 ， 只 有 触发 器 “B” 得 到 使 能 信号 。 触 发 器 
“A” 并 没有 关闭 ， 因 为 设计 中 的 其 他 地 方 用 到 了 其 输出 ， 所 以 使 得 整个 逻 
辑 云 启用 ， 并 且 浪 费 了 能 量 。 图 5. 32b 是 另 一 种 实现 方法 ,将 使 能 信号 移 
至 逻辑 云 前 ， 并 在 不 需要 使 用 逻辑 云 时 禁用 它 。 


开启 了 多 余 的 逻辑 云 使 能 量 漏 掉 | 





图 5.32 使 逻辑 云 失效 以 降低 功 耗 
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失效 的 逻辑 云 节省 了 能 量 
b) 


图 5.32 〈 续 ) 


5.7 寄存 器 级 低 功 耗 技术 


每 代 新 的 硅 工 艺 都 会 相应 带 来 功 耗 的 降低 。 以 因子 @ 缩减 的 工艺 节点 
会 将 功 耗 降低 至 1/@B”。 工 艺 在 迅速 缩小 至 深 亚 微 米 级 ,不 久 就 会 到 达 
40nm。 随 着 各 种 新 CMOS 生产 工艺 的 出 现 会 将 功 耗 降 低 到 一 个 新 的 水 平 。 


5.7.1 技术 水 平 


在 本 章 中 ， 前 面 提 到 的 所 有 降低 功 耗 的 技术 都 可 以 由 电路 设计 人 员 直 
接 实现 。 通 过 更 先进 的 硅 处 理 技术 ， 可 以 额外 降低 功 耗 。 


5.7.2 版 图 优化 


在 版 图 阶段 进行 优化 可 以 显著 降低 功 耗 。 理 想 的 优化 意味 着 所 有 有 直 
接 关联 的 模块 在 硅 片 上 都 应 紧密 挨 在 一 起 。 长 布线 会 增加 功 耗 。 遗 憾 的 
是 ,复杂 的 SoC 使 得 越 来 越 难以 达到 这 种 结果 。 


5.7.3 衬 底 偏 压 


由 于 漏电 流 是 阐 值 电压 内 的 函数 ， 如 图 5. 33 所 示 ， 衬 底 偏 压 也 称 作 
“ 反 偏 压 ”能 减少 漏电 功 耗 。 采 用 这 种 技术 ,可 以 将 衬 底 或 合适 的 阱 区 电 
压 偏 置 ， 以 提高 晶体 管 阔 值 ， 因 此 减少 了 漏电 。 在 PMOS 中 ， 指 将 晶体 管 
衬 底 偏 置 到 高 于 Vs 的 水 平 。 在 NMOS 中 ， 指 将 衬 底 电压 偏 置 到 低 于 及. 的 
水 平 。 
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Zea 
及 


bn 


图 5.33 衬 底 偏 压 


VW 的 升 高 也 会 影响 性 能 ， 因 此 可 以 使 用 动态 偏 置 的 方式 ， 即 在 工作 模 
式 下 保持 较 小 的 偏 置 电压 ， 而 在 保持 模式 下 加 强 偏 置 电压 。 衬 底 偏 压 的 效 
果 与 工艺 尺寸 有 关 ， 所 以 在 使 用 更 小 工艺 时 ， 衬 底 偏 压 的 效果 会 大 大 
降低 。 


5.7.4 减少 氧化 层 厚 度 


栅 氧 化 层 是 门 栅 和 沟 道 之 间 的 绝缘 体 ， 常 常 将 它 做 得 尽 可 能 薄 ， 以 使 
晶体 管 在 打开 时 将 沟 道 的 导电 性 和 性 能 增 至 最 大 ， 并 在 晶体 管 关闭 时 将 阔 
限 下 漏电 流 降 到 最 低 。 然 而 ， 在 电流 栅 氧 化 层 厚 度 在 1. 2nm 附近 时 ， 会 在 
门 机 和 沟 道 之 间 发 生 电 子 隧道 效应 的 量子 力学 现象 ， 使 功 耗 增加 。 绝 缘 
体 比 硅 氧化 物 有 更 大 的 介 电 常数 ( 称 为 高 k 介 电 质 ) ， 如 混合 型 金属 硅 酸 
盐 。 如 在 45nm 以 及 更 小 工艺 中 使 用 欠 和 钳 硅 酸 盐 氧化 物 来 减少 栅 漏 
电流 1s 


5.7.5 多 氧化 层 器 件 


多 氧化 层 器 件 与 5.7.4 节 中 的 描述 很 相似 ， 除 了 厚 氧化 层 头 部 /尾部 
开关 也 用 来 降低 栅 漏 电流 。 


5.7.6 利用 定制 设计 减 小 电容 


下 面 公 式 中 的 Co 为 三 种 电容 之 和 : 
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Ge = Go tC TG 
式 中 Ci = 扇 出 门 的 输入 电容 
C, = 线 电容 
C, = 寄生 电容 


对 于 深 亚 微米 技术 ，C, 是 最 主要 的 一 种 电容 ， 遗 憾 的 是 ， 它 也 是 最 难 


估计 的 一 种 电容 。 必 须 将 “串扰 ”之 类 复杂 效应 考虑 在 内 。 


由 于 设计 者 很 难 对 门 级 以 下 的 单元 进行 布局 布线 ， 因 此 对 这 些 单元 的 
参数 无 法 产生 重要 影响 。 而 使 用 定制 设计 就 可 以 对 这 样 的 参数 进行 强 有 力 


的 控制 。 
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第 6 章 


流水 线 的 艺术 


对 高 速 ASIC 日 益 增长 的 需求 使 得 越 来 越 需要 增加 电路 每 个 时 钟 周期 
的 计算 吞吐 率 。 可 以 通过 流水 线 提高 ASIC 在 这 方面 的 性 能 ,但 是 也 会 带 
来 系统 延迟 和 面积 的 增加 。 

流水 线 通过 在 较 长 的 组 合 逻 辑 路 径 中 插入 寄存 右 降 低 了 组 合 逻 辑 的 延 
迟 ， 从 而 增加 了 时 钟 频率 并 提高 了 性 能 。 

图 6. 1 为 插入 流水 线 前 的 组 合 逻 辑 电 路 。 图 6. 2 为 插入 流水 线 后 的 电 
路 示意 图 。 


图 6.1 非 流水 线 电 路 中 的 组 合 路 径 


图 6. 1 中 的 组 合 路 径 延 迟 为 《个 时 间 单 位 (在 4 点 和 B 点 之 间 )。 同 
样 的 路 径 在 图 6. 2 中 通过 插入 三 个 寄存 器 被 分 割 成 多 个 小 块 ， 寄 存 器 间 的 
延迟 为 了 个 时 间 单 位 ， 这 里 Y<X。 
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图 6.2 ”流水线 电路 中 相对 较 小 的 延迟 


从 图 6. 2 中 能 很 明显 地 看 出 在 长 组 合 路 径 中 加 入 三 个 寄存 器 之 后 时 钟 
频率 明显 地 增加 了 ， 但 是 同时 也 增加 了 额外 的 开销 ， 并 且 增 加 了 系统 延 
迟 。 许 多 因素 都 会 影响 最 大 时 钟 频率 。6. 2 节 在 深入 介绍 流水 线 之 前 ， 简 
要 地 阐述 这 一 内 容 。 


6.2 影响 最 大 时 钟 频 率 的 因素 


时 钟 频率 是 数据 流 和 人 系统 后 在 输出 端 出 现 的 速率 。 有 许多 因素 都 会 影 
响 流水 线 系统 的 最 大 时 钟 频率 。 首 先 ， 考 虑 图 6. 3 中 所 示 的 两 条 流水 线 阶 
段 之 间 的 理想 路 径 。 





[0 0 一 


图 6.3 寄存 器 到 寄存 器 路 径 间 的 理想 状况 


这 里 

7 : 寄存 器 4 和 B 间 的 组 合 延 迟 
Ts: 寄存 器 4 的 建立 时 间 

Ta : 寄存 器 4 的 保持 时 间 

Tew: 寄存 器 4 的 时 钟 输出 延迟 
Tss: 寄存 器 B 的 建立 时 间 

Tus: 寄存 器 B 的 保持 时 间 

Tcos: 寄存 器 B 的 时 钟 输出 延迟 
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对 于 没有 任何 抖动 的 理想 时 钟 ， 时 钟 信号 同时 到 达 两 个 寄存 器 块 ， 假 
设 寄存 器 4 时 钟 到 输出 的 延迟 (Tcos) 为 0， 寄 存 器 了 的 数据 建立 保持 时 
间 (分 别 为 Ts 和 Tus) 也 为 0， 最 大 时 钟 频率 PR 是 通过 组 合 逻 辑 的 最 大 
路 径 延 迟 的 倒数 ， 即 : 
有 


在 实际 的 电路 中 ， 有 许多 其 他 的 因素 也 会 对 时 钟 频率 产生 影响 ， 如 时 
钟 偏 移 和 抖动 。 下 面 将 会 加 以 讨论 。 


6.2.1 时 钟 偏 移 


在 实际 电路 中 ， 由 于 存在 线路 上 的 传播 延迟 ， 寄 存 器 B 的 时 钟 输入 
(参考 图 6.3) 相对 于 寄存 器 4 可 能 会 有 一 些 延 迟 。 

这 些 传播 延迟 中 的 微小 差别 ， 会 发 生 在 复杂 数字 产品 的 整个 时 钟 网 络 
上 ， 最 后 会 对 整 系统 时 序 产生 无 法 接受 的 影响 。 这 种 现象 也 称 为 “时 钟 偏 
移 ” 问 题 ” 。 

在 相 邻 两 个 寄存 器 的 时 钟 延迟 大 于 这 两 个 寄存 器 之 间 的 数据 路 径 延 迟 
时 ， 就 会 产生 负 时 钟 偏 移 。 在 这 种 情况 下 ， 先 到 的 时 钟 会 引起 竞争 条 件 。 
即 ， 在 数据 还 未 成 功 锁 存 时 时 钟 就 触发 了 寄存 器 ” 。 时 钟 偏 移 倾向 于 增加 
电路 所 能 承受 的 最 大 时 钟 频率 。 


6. 2.2 时 钟 抖动 


到 达 电 路 中 某 一 点 的 连续 时 钟 边沿 之 间 间 隔 的 变化 称 为 时 钟 拌 动 4,。 
如 图 6.4 所 示 ， 时 钟 拌 动 会 影响 时 钟 的 占 空 比 。 让 我 们 看 看 在 实时 电 
路 中 上 述 因 素 对 最 大 时 钟 频率 的 影响 。 图 6.5 是 典型 的 组 合 电路 路 径 。 粗 
体 显示 的 路 径 (b、f jj、 i、m、n 和 o) 是 两 个 寄存 器 之 间 最 大 延迟 的 





路 径 。 
理想 时 钟 | | | | | 
Thr 
fi 
含有 拌 动 的 时 钟 1 


图 6.4 时 钟 工 作 周 期 内 抖动 的 影响 
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图 6.5 粗 体 显示 带 有 最 大 组 合 延迟 的 关键 路 径 


国 ) 注意 
路 径 c、g、j、 I m、n、0 和 b、f、j、I、m、n、0 的 延迟 相同 ,但 
是 这 里 在 计算 最 大 频率 时 只 使 用 了 后 者 。 


让 我 们 算 一 下 从 寄存 器 “Br ”到 输出 “o” 之 间 精 确 的 组 合 延迟 。 以 
上 路 径 的 时 序 图 见 图 6. 6。 


CLK J 1 


: tcQ :taNp : fnv : thor :lanp : to ”fwtfe 


图 6.6 各 时 钟 源 时 钟 对 延迟 贡献 的 时 序 图 
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Tu: 寄存 器 “bf” 的 时 钟 输出 延迟 
Tw : 与 门 延迟 
Tiw: 反 向 器 延迟 
Tvor : 或 非 门 延迟 
7,,: 触发 器 的 建立 时 间 (对 于 图 6. 5 中 输出 端的 触发 器 ) 
Tsxw + Tr: 时钟 偏 移 和 时 钟 拌 动 对 组 合 延 迟 的 总 贡献 
按照 图 6.6， 两 个 寄存 器 之 间 的 路 径 b、f、j、I、m、n、o 的 总 延 
述 为 : 
i Toco + "Tt Tt Trons+t 8 .Tw + Tm 
Ti = Too + To tT + Tsexw + Tir 


因此 对 于 给 定 电路 使 用 下 面 的 公式 来 计算 最 大 周期 : 


{Tr = 1 Fs 让 + Tskw A 
假设 设计 中 所 有 触发 器 的 延迟 相等 〈 实 际 情况 不 可 能 这 样 ) ， 那 么 
得 到 : 
(De CR A (6.1) 


上 面 等 式 中 的 组 合 延迟 部 分 可 以 通过 添加 多 个 触发 器 来 减少 ， 因 此 增 
加 了 电路 操作 的 最 大 频率 。 这 种 减少 流水 线 各 阶段 组 合 延迟 的 方法 能 显著 
提升 电路 的 吞吐 率 (计算 并 未 完成 )， 后 续 几 节 将 进行 详细 的 介绍 。 


6. 3 流水 线 


流水 线 使 用 存储 器 件 将 时 钟 周期 内 关键 路 径 (最 大 组 合 延 迟 的 路 径 ) 
分 割 开 来 。 这 减少 了 关键 路 径 上 各 阶段 延迟 并 使 电路 能 以 更 高 频率 工作 。 
流水 线 电路 增加 了 各 时 钟 阶段 的 计算 能 力 ， 但 是 由 于 使 用 了 存储 器 单元 也 
增加 了 负载 。 让 我 们 来 看 一 下 图 6. 7 中 执行 这 种 操作 的 电路 : 
i=(a+b+c+d)+(e+f+g+h) 
计算 图 6.7 中 两 个 触发 器 之 间 的 延迟 〈 最 大 路 径 延 迟 ) 。 
从 式 (6.1) 
le = Too > A 本 人 全 本 于 玫 
这 里 WI 三 3 了 .5 
所 以 最 终 的 时 钟 周期 为 
{Toh = To +t Tt Tw t Te et (ST (652) 
假设 有 下 列 约束 值 
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图 6.7 插入 流水 线 前 的 8 输入 加 法 器 
Too = 4FO4 
T， = 2FO4 
TT dd 
7 = 10FO4 
这 里 FO4 指 4 个 反 向 器 延迟 的 扇 出 。 
将 这 些 值 代入 式 (6.2) 中 ， 得 到 
[Te =4+2+4+3x10 
= 40FO4 
现在 让 我 们 看 一 下 同样 的 电路 插入 两 级 流水 后 的 样子 。 新 的 流水 线 电 
路 如 图 6.8 所 示 。 第 一 级 流水 线 寄存 器 加 在 第 一 次 加 法 操作 之 后 ， 在 





图 6.8 插入 流水 线 后 的 8 输入 加 法 器 


EE | 
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图 6. 8 中 表示 为 灰色 ， 其 他 流水 线 寄存 器 加 在 各 阶段 直至 加 法 器 最 终 的 输 
出 被 锁 存 住 。 
各 级 流水 状态 如 下 所 示 : 
1 1 允 本 


其 中 ee 


园 注意 
在 任何 两 个 寄存 器 之 间 现 在 只 存在 一 个 加 法 器 ， 而 不 再 是 三 个 加 
法 器 。 


{Tre} mex = Tco + Tap 十 Tskw + Tm + {1T,.) 
{Tr} =4+2+4+1x10 
= 20FO4 
在 使 用 7 个 流水 化 加 法 器 实现 8 输入 加 法 之 后 (如 图 6.8 所 示 )， 否 
吐 率 (每 个 周期 的 计算 次 数 ) 增加 至 每 个 时 钟 周期 计算 一 次 8 输入 之 和 。 
总 延迟 为 3 个 时 钟 周 期 。 
与 使 用 单 加 法 器 进行 上 述 计算 相 比 ，7 个 加 法 器 意味 着 至 少 7 倍 的 面 
积 和 功 耗 开 销 。 将 电路 并 行 化 对 功 耗 和 面积 的 影响 都 很 大 。 一 般 来 说 ， 使 
用 并 行 电路 进行 同样 的 次 操作 ， 比 重复 使 用 某 一 人 逻辑 次 达到 同样 的 效 
果 在 面积 和 功 耗 方面 的 开支 更 大 ， 因 为 使 用 了 更 多 的 触发 器 和 额外 人 逻辑 ， 
导致 了 更 多 的 连 线 。 


6. 4 ”解释 流水 线 一 一 一 个 真实 的 例子 


在 讨论 CPU 技术 时 经 常会 出 现 “ 流 水 线 ” 这 个 词 , 但 是 很 少 看 到 它 
的 定义 。 尽 管 流 水 线 的 含义 很 简单 ， 本 章 仍 会 用 类 比 的 方式 来 解释 它 的 工 
作 原 理 。 让 我 们 来 看 看 汽车 生产 工序 中 的 各 阶段 。 

阶段 1: 建造 底盘 ; 

阶段 2: 将 引擎 放 人 底盘 ; 

阶段 3: 安装 车 门 、 外 壳 并 罩 住 底盘 ; 

阶段 4: 安装 轮子 ; 

阶段 5: 给 汽车 上 漆 。 

如 果 在 汽车 制造 流程 中 使 用 流水 生产 线 ， 最 好 使 用 5 组 专业 人 员 ， 每 
个 阶段 一 组 。 一 组 建造 底盘 ， 一 组 建造 和 安装 引擎 ， 另 一 组 安装 轮子 等 。 
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完成 每 个 阶段 需要 1 个 小 时 。 这 就 是 流水 生产 线 的 工作 原理 。 

将 所 有 5 组 人 员 排 成 一 行 ， 第 一 组 人 员 开始 第 1 阶段 工作 。 第 一 阶段 
工作 完成 后 ， 将 汽车 沿 着 生产 线 送 到 下 一 个 阶段 ， 由 下 一 组 人 员 放 人 和 人 引 
擎 。 在 第 2 阶段 人 员 向 底盘 中 安装 引擎 时 ， 第 一 组 人 员 (以 及 所 有 其 他 阶 
段 的 人 ) 是 空闲 的 。 第 2 阶段 完成 后 汽车 被 送 至 第 3 个 阶段 ， 由 第 三 组 人 
员 接管 工作 ， 而 第 二 组 人 员 进 入 空闲 状态 。 

按 这 种 方式 汽车 沿 着 生产 线 向 下 流动 ， 每 次 只 有 某 一 阶段 的 人 员 处 于 
工作 状态 ， 而 其 他 人 都 是 空闲 的 。 在 第 5 个 阶段 完成 时 ， 第 1 个 阶段 开始 
生产 另 一 辆 汽车 。 按 这 种 速度 制造 一 辆 汽车 要 5 个 小 时 ， 即 工厂 每 5 小 时 
才能 送出 一 辆 汽车 。 

另 一 种 组 织 方式 是 雇用 一 个 专职 团队 完成 全 部 工作 。 由 于 组 装 汽车 需 
要 5 种 特定 的 技能 ， 如 果 雇 用 5 个 高 度 专业 化 的 团队 来 完 所 有 工作 ， 比 雇 
用 一 个 团队 能 达到 更 快 的 效果 ， 因 为 一 个 团队 很 难 对 所 有 5 个 阶段 的 工作 
都 很 擅长 。 

如 果 适 当地 调整 各 团队 的 时 间 安 排 表 和 工作 流程 ， 每 个 小 时 就 可 以 产 
出 一 辆 汽车 ， 这 便 极 大 地 提高 了 装配 线 的 生产 效率 。 

第 一 组 做 好 底盘 后 交 给 第 二 组 ， 在 第 二 组 安装 引擎 的 同时 ， 第 一 组 开 
始 制作 另 一 个 底盘 。 

在 流水 线 满 负 荷 运转 时 ，5 组 人 员 同 时 工作 ， 这 样 每 小 时 就 能 生产 出 
一 辆 汽车 了 : 即将 生产 效率 提高 了 5 倍 。 这 就 是 流水 生产 线 的 样子 ， 简 单 
来 说 ， 就 是 流水 线 。 

所 以 ， 回 到 数字 设计 的 世界 中 ， 下 一 节 会 介绍 大 量 提高 数据 设计 性 能 
的 详细 方法 。 


6. 5 来 自 于 流水 线 的 性 能 提高 


如 图 6. 9 所 示 ， 在 两 个 寄存 器 之 间 存 在 一 个 大 规模 组 合 逻 辑 矩 阵 。 

流水 线 的 延迟 是 从 数据 进入 流水 线 的 输入 端 到 这 些 数据 经 过 处 理 后 从 
流水 线 的 输出 端 输出 所 消耗 的 时 间 。 

图 6. 9 中 所 示 的 电路 只 有 一 个 流水 线 阶 段 (也 称 为 非 流 水 线 阶段 )。 
整个 电路 的 延迟 即时 钟 周 期 。 


/NE Te + a 二 和 clocking 


(63) 
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这 里 7 是 寄存 器 开支 三 Teo +7T 
Tu 是 时 钟 开 文 = 了 Tskw + Tir o 





+ 一 Ta 人 
图 6.9 捅 和 流水线 前 的 逻辑 〈 非 流水 线 电 路 ) 


图 6. 10 中 是 把 同样 的 电路 插入 级 流水 线 的 结果 。 
任意 阶段 的 周期 为 : 

Ts 2 (0 stage 十 了 register 生 es 

延迟 最 大 的 流水 线 阶段 决定 时 钟 周 期 对 于 任意 阶段 : 

Ti 

延迟 是 时 钟 周期 的 n 售 ， 因 为 各 阶段 的 延 述 就 是 时 钟 周期 。 

多 Si 


latency pipeline 


二 max | Td Po 1 


clocking 





二 TIN 有 一 全 所 工时 &2 一 过 To 


图 6.10 插入 nn 级 流水 线 后 的 逻辑 


理想 状况 下 ， 各 级 流水 线 的 延迟 应 当 相 等 ， 以 使 流水 线 中 最 大 的 组 合 
逻辑 延迟 相同 。 
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了 

Te (6.4) 

所 以 对 任意 流水 线 阶段 ， 最 小 可 能 的 时 钟 周 期 为 : 
了 os 2 2 (6.5) 

因此 对 于 理想 时 钟 最 终 的 延迟 为 : 

Thioline jdeal = TT ipeline = 了 + n( et a (6.6) 

现在 就 能 计算 出 插入 流水 线 后 电路 速度 的 增加 了 : 
速度 增加 = = (6.7) 
这 里 Fs 插入 流水 线 后 的 时 钟 频率 ，F. 是 插入 流水 线 前 的 时 钟 

频率 。 

速度 增加 = Te (6.8) 





从 式 (6.3) 和 式 (6.5) 可 以 得 到 


YW Ve 
速度 增加 = 一 一 一 ne 一 


We 
(us + 了 | 


register 


对 未 插入 流水 线 的 电路 ， 设 寄存 器 和 时 钟 开支 占 总 时 钟 周期 的 百分比 


为 ， 则 : 
E To + Tang (6.9) 


将 k 代 入 式 (6.8) 得 到 
速度 增加 = -一 一 (6. 10) 


全 +k 
系统 吞吐 率 是 每 个 时 钟 内 完成 的 计算 量 。 因 此 流水 线 系统 的 性 能 可 以 
定义 为 : 
, ”插入 流水 线 前 每 个 指令 平均 运算 时 间 
流水 线 系统 的 性 能 = 插入 流水 线 后 每 不 指令 平均 运算 时 间 


设 每 个 时 钟 周期 了 执行 的 指数 为 IPC， 
则 每 条 指令 的 执行 时 间 为 7ZTPC， 
代入 上 面 的 值 ， 得 到 性 能 的 增加 : 


PC x Ts 
性 能 增加 = PC (6. 11) 
上 i 
Ce (1 — ] 
十 天 


n 





《63129 
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以 上 方式 假设 IPCi, <1PC,。， 并 且 在 对 电路 插入 流水 线 后 不 再 使 用 
任何 微 结构 特性 来 提高 IPC。 

让 我 们 通过 一 个 实际 的 例子 来 理解 流水 线 对 性 能 的 提高 : 

从 Pentium III 到 Pentium IV， 流 水 线 级 数 从 10 增加 到 20， 使 每 周期 指 
令 数 (IPC) 减少 了 20% 。 假 设 相 对 于 非 流 水 线 电 路 会 衡 定 增加 2% 的 时 
序 开支 ， 通 过 下 面 的 方式 来 计算 性 能 增加 : 











Ca 
可 以 看 到 ， 在 同样 的 工艺 下 ， 尽 管 流 水 线 级 数 增加 了 2 倍 ， 但 Pentium 
IV 仅仅 比 Pentium III 提高 了 37% 的 性 能 。 


注意 
在 Pentium IV 中 JPC 减少 20% ， 是 由 于 错误 的 分 支 预测 ， 流 水 线 停 止 
和 与 Pentium III 相 比 高 度 复杂 的 还 加 所 导致 的 。 


让 我 们 看 看 DLX 微 处 理 器 中 指令 流程 的 实际 例子 。 


DLX 指令 集 的 实现 


DLX 是 新 兴学 院 派 标准 结构 的 理论 32 位 RISC 微 处 理 器 。 每 条 DLX 指 
令 最 多 由 5 个 部 分 组 成 。 

指令 获取 (Instruction Fetch，IF)、 指 令 解 码 (Instruction Decode， 
ID ) 、 执 行 / 有 效 地 址 周期 (Execution/Effective Address Cycle，EX) 、 存 储 
器 访问 (Memory Access，MEM) ， 和 写 回 操作 (Write Back，WB) 。 

未 插入 流水 线 的 实现 方式 并 不 能 达到 最 经 济 和 最 高 的 性 能 。 所 以 很 自 
然 会 使 用 流水 线 设计 实现 。 

每 个 DLX 指令 最 多 用 5 个 时 钟 周期 完成 。 这 5 个 时 钟 周期 为 : 

1. 指令 获取 (IF) 

IR < = MEMI[PC] 
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NPC <= PC+4 
操作 : 
。 从 存储 器 中 获取 指令 (用 PC 指针 ) 并 放 入 指令 寄存 器 (IR)。 
。 IR 保存 下 个 时 钟 周期 所 需 指 令 。 
。 PC 值 递增 4， 指 向 下 一 个 指令 地 址 。 
2. 指令 解码 /寄存 器 获取 (ID) 
A = Reg[IRaa 
BR |] 
MM < = TR Rl 
操作 : 
。 分 析 IR 中 的 指令 并 访问 寄存 器 堆 以 读 取 寄 存 器 。 
。 将 通用 寄存 器 的 输出 读 人 两 个 临时 寄存 器 4 和 B， 供 以 后 使 用 。 
。 IR 的 高 16 位 经 过 符号 扩展 保存 到 临时 寄存 器 IMM 中 供 以 后 
使 用 。 
。 由 于 指令 格式 是 固定 的 ， 因 此 读 寄存 器 和 解码 可 以 并 行进 行 ( 域 
[IR。;]」 指定 操作 类 型 ) 。 这 称 为 固定 域 译 码 。 
3. 执行 /有 效 地 址 周期 (EX) 
ALU 对 上 一 个 时 钟 周期 准备 好 的 操作 数 进行 操作 ,根据 DLX 指令 的 
类 型 执行 下 面 4 个 功能 中 的 一 个 : 
a) 访问 存储 器 
ALUoutput < = A + IMM 
操作 : 
。 ALU 通过 加 法 运算 形成 有 效 地 址 ， 并 将 结果 放 入 寄存 器 
ALUoutput 中 。 
b) 寄存 器 一 寄存 器 ALU 指令 
ALUoutput <=AopB 
操作 : 
。 ALU 根据 操作 码 对 寄存 器 4 和 寄存 器 B 中 的 数值 进行 操作 ， 把 结 
果 放 在 临时 寄存 器 ALUoutput 中 。 
c) 寄存 器 一 立即 数 ALU 指令 
ALUoutput < = A op IMM 
操作 : 
。 ALU 根据 操作 码 对 寄存 器 A 和 寄存 器 IMM 中 存放 的 值 进行 操作 ， 
把 结果 放 入 临时 寄存 器 ALUoutput 中 。 
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d) 分 支 指令 
ALUoutput < = NPC + IMM 
Cond <= (A op 0) 
操作 : 
。 ALU 将 NPC 和 IMM 中 的 带 符号 立即 数 相 加 ， 计 算出 分 支 的 目标 
地 址 。 


。 检查 寄存 器 A (在 前 一 个 周期 读 取 ) 的 值 来 决定 是 否 进行 分 支 。 
比较 操作 op 是 由 分 支 操作 码 所 决定 的 关系 操作 符 。 

4. 访问 存储 器 /分 支 完成 周期 ( MEM) 

这 个 周期 里 有 效 的 DLX 指令 只 有 载 人 、 存 储 和 分 支 

a) 访问 存储 器 
LMD < = Mem[ ALUoutput] 或 Mem[ ALUoutput] < = B 

操作 : 

。 如 果 指 令 为 载 人 操作 ， 则 把 从 存储 器 中 返回 的 数值 存 人 LMD 寄存 
器 中 。 

。 如 果 指 令 为 存储 ， 则 将 寄存 器 B 的 值 写 人 存储 器 。 


[图 | 注意 


ALUoutput 是 ALU 阶段 寄存 器 的 输出 。 


b) 分 支 
If (cond ) 
PC < =ALUoutput 
Else 
PGC<.=NPU 
操作 : 
。 如 果 指 令 分 支 ， 就 用 ALUoutput 寄存 器 中 的 分 支 目标 地 址 替代 PC 
中 的 值 ， 否 则 用 NPC 寄存 器 中 递增 的 值 蔡 代 PC 中 的 值 。 
5. 写 回 周期 (WB) 
a) 寄存 器 一 寄存 器 ALU 指令 
Reg[IR,。] < = ALUoutput 
b) 寄存 器 一 立即 数 周 期 
Reg[ IR,, 1s] < = ALUoutput 
c) 取 指 令 
ReglIRe 3] < 二 EMD 


136 8 第 6 章 流水 线 的 艺术 


操作 : 
。 以 上 操作 将 结果 写 回 到 寄存 器 堆 中 ,结果 可 能 来 自 于 存储 器 
(LMD) 或 来 自 于 ALU (ALUoutput)。 
图 6. 11 是 无 流水 线 时 DLX 数据 通路 上 的 5 个 步骤 (IF、ID、EX、 
MEM、WB) 。 





指令 获取 (IEF) :指令 解 码 (ID)  : 执行 : 存储 器 访问 。 ; 写 回 





图 6.11 单 周 期 DLX 数据 路 径 


这 里 无 法 并 行 执行 指令 。 只 有 在 第 一 条 指令 执行 完成 后 才 开始 执行 第 
三 条 指令 。 

这 种 情况 下 执行 一 条 指令 需要 8ns。 指 令 按 顺序 一 条 接 一 条 执行 。 所 
以 4 条 指令 的 集合 需要 8 x4 =32ns 才能 执行 完 ， 见 图 6. 12。 











图 6. 12 非 流 水 线 系统 中 的 执行 顺序 
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6.7 流水线 对 吞吐 率 的 影响 


现在 我 们 来 对 图 6. 11 中 的 电路 加 以 改造 ， 对 5 级 操作 中 的 每 个 都 加 上 
一 个 流水 线 阶段 〈 即 在 每 个 阶段 加 入 一 组 寄存 器 ) 。 修 改 后 的 新 流水 线 电 
路 如 图 6. 13 所 示 。 


指令 获取 (IF) 指令 解码 (ID) 执行 存储 器 访问 ” 写 回 























6.13 ”使 用 流水 线 的 DLX 数据 通路 


每 个 时 钟 都 获取 一 条 指令 并 开始 后 序 的 5 个 执行 周期 (如 图 6. 14 
所 示 )。 

在 图 6. 11 中 的 原始 单 周 期 DLX 数据 通路 中 ， 指 令 无 法 并 行 执行 ， 所 
以 只 有 在 前 一 条 指令 执行 完成 后 才能 处 理 新 的 指令 。 所 以 ,假设 单 周 期 时 
钟 周期 是 10ns， 依次 执行 5 条 指令 所 用 时 间 为 5 x 10ns =50ns。 

然后 看 看 图 6. 14 的 多 周期 数据 通路 。 此 时 每 条 指令 需要 5 个 时 钟 周期 
完成 ， 但 每 个 周期 只 需 2ns。 现 在 ， 如 果 5 条 指令 像 在 单 周 期 数据 通路 中 
那样 连续 执行 ， 将 花费 5 x5 x2 =50ns ( 即 5 条 指令 每 条 花费 5 个 时 钟 周 
期 每 个 时 钟 周期 为 2ns) 。 然 而 ,对 于 流水 线 模式 中 同样 的 数据 通路 ， 只 
需要 5 个 时 钟 周期 就 可 以 执行 完 5 条 指令 ， 如 图 6.6 所 示 ， 也 就 是 说 ，5 
条 指令 只 需 9 x2ns = 18ns 就 可 完成 。 因 此 流水 线 使 性 能 增加 了 50/18 =2. 8 
倍 ( 对 单个 指令 保持 延迟 值 不 变 ) 。 
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单 周期 DLX 数 据 通路 | IF | ID | 是 


周期 1 周期 2 周期 3 周期 4 周期 5 


多 周期 DLX 数 据 通路 | | 





周期 1 周期 2 周期 3 周期 4 周期 5 周期 6 周期 7 周期 8 周期 9 周期 10 
含 流 水 线 的 DLX 
数据 路 径 


指令 执行 次 序 





图 6. 14 指令 延迟 和 吞吐 率 


需要 注意 的 是 ， 在 使 用 流水 线 时 会 引入 额外 的 开销 ， 如 时 钟 偏 移 和 寄 
存 器 延迟 。 这 种 开销 〈 在 图 6. 14 没有 表现 出 来 ) 限制 了 所 能 达到 的 加 
速 值 。 


6.8 流水 线 原理 


。 所 有 共享 一 条 流水 线 的 指令 的 阶段 和 阶段 次 序 必须 相同 。 例 如 ， 
“add” 指 令 在 存储 器 阶段 中 什么 也 不 做 。 

。 所 有 中 间 值 必须 在 各 周期 锁 存 。 

。 不 能 复 用 任何 功能 模块 。 

。 一 个 阶段 中 的 所 有 操作 都 应 在 一 个 周期 内 完成 。 


6.9 ”流水 线 冒 险 


冒险 会 干扰 流水 线 并 阻止 下 一 条 指令 在 目标 时 钟 周期 内 的 执行 。 冒 险 
会 降低 流水 线 在 理想 情况 下 所 能 带 来 的 速度 提升 。 
冒险 分 类 : 
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。 结构 冒险 ”由 于 资源 冲突 而 使 硬件 无 法 支持 所 有 可 能 的 指令 组 合 
同时 执行 。 
。 数据 冒险 ”指令 执行 需要 之 前 指令 的 计算 结果 ， 而 这 个 结果 在 流 
水 线 中 还 没有 计算 出 来 。 
。 控制 冒险 ”分 支 的 流水 线 和 其 他 指令 改变 程序 计数 器 的 值 。 
解决 以 上 间 题 的 通用 方法 是 停止 流水 线 直 至 风险 消除 ， 在 流水 线 中 插 
入 多 个 “气泡 ”( 缺 口 )。 


6. 9. 1 结构 冒险 


在 结构 冒险 中 ,硬件 无 法 同时 支持 所 有 可 能 的 指令 组 合 重合 执行 。 结 
果 会 导致 资源 冲突 ， 即 多 个 指令 要 求 访问 同一 地 址 。 
例如 ， 在 图 6. 15 中 使 用 单 端口 存储 器 执行 载 人 指令 的 操作 。 








时 间 《 时 钟 周 期 ) 





图 6.15 指令 载 人 流水 线 过 程 中 发 生 的 存储 器 冲突 


这 里 有 两 条 指令 ( 见 图 6.15) 在 同一 个 时 钟 周期 内 要 求 访问 同一 存储 
器 (一 个 在 MEM 阶段 ， 另 一 个 在 正 阶段 ) ， 因 此 就 会 产生 存储 器 冲突 。 

上 述 问题 的 简单 解决 方法 是 在 发 生 冲 突 时 将 流水 线 停 一 个 时 钟 周期 。 
这 样 会 产生 一 个 流水 线 气泡 (如 图 6. 16 所 示 ) 。 这 样 可 以 在 增加 一 个 时 钟 
延迟 的 情况 下 执行 同样 数目 的 指令 。 

另 一 种 解决 方案 是 在 下 和 MEM 阶段 使 用 不 同 的 存储 器 以 避免 同时 访 
问 同一 块 存储 器 的 冲突 。 这 样 虽然 解决 了 冲突 冒险 ,但 是 消耗 了 更 多 的 
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时 间 〔 时 钟 周期 ) 一 











图 6.16 在 流水 线 中 加 入 气泡 以 阻止 结构 冒险 


6. 9.2 数据 冒险 


在 数据 冒险 中 ， 当 前 指令 的 执行 需要 依赖 前 面 指令 执行 的 结果 。 例 
如 ， 对 于 下 面 的 指令 序列 : 
ADD RI1, R2, R3 (RI1 =RI +R2+R3) 
XOR R4, R5, RI 
SUB R7, R1, R6 
OR R9, R8, RI 
第 一 条 指令 后 的 所 有 指令 都 使 用 R1 (如 图 6. 17 所 示 )。 
按 图 6. 17 中 的 方式 ，ADD 之 后 的 指令 无 法 得 到 正确 的 执行 结果 ， 因 
为 在 其 指令 周期 的 了 D 阶段 ADD 之 后 的 所 有 指令 的 ID 阶段 都 需要 ADD 指 
令 的 结果 (在 WB 阶段 输出 ) 。 


ADD R1, R2, R3 


_ | XOR R4, R5,Rl 
指令 执行 
次 序 | suB R7,RlR 





OR R9, R8, R1 


图 6. 17 流水 线 指令 集中 的 数据 冒险 
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解决 这 种 冒险 的 常用 方法 是 数据 /寄存 器 转移 。 其 原理 是 选择 的 数据 
实际 上 并 不 在 图 6. 17 所 示 的 ID 阶段 使 用 ， 而 是 在 图 6. 18 中 的 ALU (EX) 
阶段 使 用 。 


时 间 ( 时 钟 周期 ) 














XOR R4, R5, R1 


SUB R7, R1, R6 





OR R9, R8, R1 


图 6.18 转移 以 避免 数据 冒险 


数据 转移 规则 如 下 : 

。 第 一 条 指令 (该 指令 的 输出 会 在 后 续 指 令 中 使 用 ) 的 EXZMEM 组 
存 输出 的 所 有 数据 始终 送 到 下 一 条 指令 的 ALU 输入 端 (如 图 6. 18 
所 示 )。 

。 如 果 转 移 硬件 探测 到 源 操作 数 有 更 新 ， 逻 辑 电路 会 选择 使 用 更 新 
的 结果 ， 而 不 是 来 自 于 寄存 器 文件 (ID/EX 缓存 器 ) 的 数据 。 
图 6. 19 为 使 用 多 路 器 实现 此 操作 的 示意 图 。 





图 6. 19 实现 数据 转移 对 硬件 做 出 的 改进 


。 结果 不 仅 需要 从 前 一 条 指令 转移 ， 还 需要 从 三 个 周期 前 开始 的 指 
令 转移 (如 图 6. 18 中 的 1、2、3 所 示 )。EX/MEM (一 个 周期 
前 ) 和 MEMAWB (两 个 周期 前 ) 的 结果 转移 到 两 个 ALU 的 输入 
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端 (如 图 6.18 中 的 1、2 所 示 )。 
。 在 时 钟 周 期 的 前 半 段 读 寄 存 器 堆 ， 在 该 时 钟 周期 的 前 半 段 写 寄 存 
器 堆 (三 个 周期 之 前 ， 如 图 6. 18 所 示 ) 。 
存在 影响 电路 得 到 正确 结果 的 几 种 不 同类 型 的 数据 冒险 。 
。 读 后 写 (RAW) : 这 是 最 常见 的 数据 冒险 ， 可 用 数据 转移 解决 。 
。 写 后 写 (WAW) : 两 条 连续 指令 先后 写 同 一 寄存 器 ,但 写 次 序 颠 
倒 。DLX 通过 在 WB 阶段 等 待 写 人 寄存 器 的 方式 避免 这 个 问题 。 
所 以 在 DXL 中 不 存在 WAW 风险 。 
。 写 后 读 (WAR) : 这 里 ， 在 前 一 条 指令 读 出 寄存 器 的 值 (错误 值 ) 
后 ， 下 一 条 指令 才 写 人 该 寄存 器 。 这 种 情况 在 DLX 中 也 不 会 发 生 ， 
因为 所 有 指令 会 先 读 (在 了 阶段 ) 后 写 (在 WB 阶段 ) 。 
因此 ， 数 据 转 移 不 能 解决 所 有 类 型 的 数据 冒险 。 代 表 性 的 是 直到 
MEMZWB 阶段 数据 才能 使 用 的 情况 。 
例如 ， 对 于 下 面 的 指令 : 
LW R1, 0 (R2) LOAD 指令 
XOR R4, R5, RI 
SUB R7, R1, R6 
OR R9, R8, RI 
如 图 6. 20 所 示 ， 路 径 1 永远 无 法 实现 ， 因 为 XOR 指令 需要 在 ALU 的 
输入 端 使 用 RI 寄存 器 中 的 值 ， 而 该 值 在 LW 指令 (从 MEM/WB 缓冲 区 ) 
执行 后 才能 更 新 。 


时 间 《〈 时 钟 周期 ) 









SUB R7, R1, R6 


OR R9, R8, RI1 


图 6.20 使 用 转移 仍 会 出 现 的 数据 冒险 
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一 种 简单 的 解决 方法 是 使 用 如 图 6. 21 所 示 的 “纵向 气泡 ”将 ALU 周 
期 延迟 一 个 时 钟 。 








时 间 《〈 时 钟 周期 ) 








LW R1, 0G2)|MEM 





XOR R4, R5, R1 
指令 执行 
次 序 


SUB R7, R1, R6 


OR R9, R8, R1 








图 6.21 通过 创建 垂直 气泡 来 解决 数据 冒险 


除了 使 用 硬件 技术 ， 也 可 以 使 用 基于 编译 器 调度 的 软件 方式 来 解决 数 
据 冒 险 的 问题 。 这 时 ， 编 译 器 跟踪 每 个 寄存 器 中 的 数据 并 重新 安排 指令 次 
序 以 阻止 数据 冒险 的 产生 。 


6. 9.3 控制 冒险 


这 种 冒险 通常 发 生 在 由 于 分 支 语 句 使 程序 计数 器 (PC) 发 生变 化 的 情 
况 下 。 
例如 ， 对 于 下 面 的 代码 段 : 
BNEZ RI1, LOOP 
DADD R4, R5, R6 
如 图 6. 22 所 示 ， 在 T2 周期 执行 第 二 条 指令 时 就 需要 PC 的 值 ， 但 是 
该 值 要 在 第 一 条 指令 的 MEM 操作 (周期 T4) 后 才 可 用 。 
一 种 简单 的 解决 方式 是 在 分 支 语 句 中 用 新 的 PC 值 重新 读 取 指 令 。 在 
这 种 情况 下 ， 需 要 将 流水 线 停 止 几 个 周期 直到 重新 获取 下 一 条 指令 ， 如 
图 6. 23 所 示 。 
通过 提前 预测 分 支 目 标 或 在 分 支 延 迟 空隙 间 插 入 额外 指令 ， 可 使 流水 
线 停 止 所 导致 的 控制 风险 最 小 化 。 
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指令 执行 
次 序 






DADD R4, R5, R6 


指令 执行 
次 序 
DADD R4, R5, R6 


图 6.23 由 于 控制 冒险 停止 流水 线 


6. 9.4 其 他 风险 


其 他 的 一 些 风险 也 应 该 考虑 。 在 指令 获取 或 在 数据 读 写 时 会 访问 存储 
器 。 在 指令 获取 时 ， 数 据 应 该 由 PC 寄存 器 保持 稳定 。 该 值 应 该 一 直 保持 
到 把 获取 的 指令 写 人 IVID 流水 线 寄 存 器 的 IR 域 为 止 。 因 此 ， 对 IF/ID 寄 
存 器 的 IR 写 操作 必须 在 PC 写 操作 之 前 。 

在 数据 读 写 时 ， 访 问 存储 器 所 用 的 有 效 地 址 在 EX 阶段 由 ALU 计算 出 
来 。 在 将 存储 器 中 的 数据 存 人 LMD 寄存 器 或 存储 器 写 信号 被 激活 使 数据 
写 人 存储 器 之 前 ， 该 地 址 不 能 变化 。 

实际 上 ，ALU 输出 值 与 存储 器 访问 是 独立 的 过 程 ， 这 就 意味 着 有 时 
EX/MEM ALU 的 输出 值 会 在 数据 写 人 MEM/WB LMD 寄存 器 前 更 新 。 需 要 
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对 这 三 个 事件 进行 严格 的 排序 以 使 EX/MEM ALU 的 输出 只 在 存储 器 访问 
完成 后 才 改变 。 注 意 ， 对 于 非 流水 线 结构 的 CPU 就 不 存在 这 样 的 问题 ， 因 
为 指令 周期 的 访问 阶段 在 执行 阶段 之 后 ， 而 只 有 在 执行 阶段 才 会 修改 EX/ 
MEM ALU 输出 的 值 。 


6. 10 ADC 中 的 流水 线 一 一 一 个 例子 


虽然 你 可 能 从 未 在 处 理 器 以 外 的 其 他 结构 中 听 到 过 流水 线 结构 ， 但 该 
理论 可 使 用 在 任何 设计 中 用 于 提高 性 能 。 

考虑 下 面 的 ADC 例子 。 含 有 流水 线 的 模 数 转换 器 (ADC) 是 最 流行 
的 ADC 结构 ， 其 取样 率 可 以 从 每 秒 几 兆 到 每 秒 100 兆 以 上 5 。 

图 6. 24 是 Maxim 的 12 位 流水 线 ADC 模块 图 ， 每 个 阶段 处 理 两 位 。 





图 6.24 maxim 的 4 级 3 位 流水 线 ADC 
图 片 来 源 : Copyright @ Maxim Intergrated Products (http: 和 maxim-ic. com) . 经 授权 使 用 


图 6. 24 为 位 流水 线 ADC 的 结构 图 。 输入 Vu 首先 被 采样 - 保持 
(S&H) 电路 所 采样 ， 同 时 第 一 级 的 内 速 ADC 把 它 量化 为 3 位 ， 然 后 把 此 
3 位 输出 传递 给 一 个 3 位 的 DAC (具有 12 位 精度 ) ， 输 入 信号 减 去 此 DAC 
的 输出 ， 放 大 4 倍 传递 给 下 一 级 〈 第 二 级 ) 。 继 续 重复 上 述 过 程 ， 每 级 提 
供 3 位 ， 直 到 它 到 达 最 后 一 级 4 位 闪 速 ADC， 该 ADC 解析 最 后 4 个 LSB。 
对 应 某 一 次 采样 ， 由 于 每 级 在 不 同 的 时 间 得 到 变换 结果 ， 因 此 在 进行 数字 
误差 校正 前 用 移 位 寄存 储 器 对 各 级 的 结果 先 按时 间 对 准 。 

注意 ， 只 要 某 一 级 完成 了 某 一 采样 的 变换 ， 得 到 结果 并 把 差 值 传递 给 
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下 一 级 ， 它 就 可 以 开始 处 理 从 每 一 级 的 采样 - 保持 电路 中 接收 到 的 下 一 个 
采样 。 因 此 流水 线 操作 提高 了 处 理 能 力 。 
本 节 摘 自 Maxim 使 用 手册 1023 “理解 流水 线 ADCs”。 
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第 7 章 
处 理 字 节 顺序 


字 节 顺序 描述 如 何在 计算 机 系统 中 表示 由 多 个 字 节 组 成 的 数据 。 

例如 ， 当 传输 单词 “TEST” 时 ， 每 个 字母 用 一 个 包 传输 ， 一 共 4 个 包 。 
传输 端 按 下 列 次 序 发 送 数据 “T 《第 一 个 发 送 )” 一 “E”-“S”-“T”( 最 
后 一 个 发 送 ) 。 如 果 没有 足够 的 信息 ， 接 收 端 可 能 以 16 种 不 同 的 组 合 方式 捕获 
和 组 装 数据 。 类 似 地 ， 假 设 用 两 个 包 来 传送 该 单词 ， 每 个 包含 两 个 字母 
(“TE” 和 “ST”) ， 接 收 端 可 能 将 数据 组 装 成 “TEST” 或 “STTE" ， 后 者 是 错 
误 的 。 同 理 ， 当 程序 或 数据 在 不 同 字 节 顺序 的 片上 系统 (SOC) 间 传 输 时 就 全 
面 对 这 样 的 问题 ， 除 非 所 有 计算 机 系统 按 同样 的 字 节 顺 序 设计 。 假 设 软件 所 访 
问 的 所 有 数据 都 是 32 位 字 ， 那 么 字 节 顺序 的 问题 并 不 明显 。 然 而 ， 如 果 软 件 所 
执行 的 指令 操作 8 位 或 16 位 数据 ， 并 且 该 数据 需要 映射 到 指定 的 存储 器 地 址 时 
(如 存储 器 映射 0) ， 就 需要 处 理 字 节 顺序 的 问题 了 。 

本 章 为 芯片 体系 结构 设计 人 员 以 及 希望 开发 字 节 中 人 性 型 代码 或 转换 字 
节 特 定型 代码 的 软件 开发 人 员 建 立 了 一 系列 基本 的 规则 。 


字 节 顺序 定义 数据 在 计算 机 系统 中 的 存储 格式 。 它 描述 存储 器 中 地 址 
的 最 高 有 效 位 (MSB) 和 最 低 有 效 位 (LSB) 的 位 置 。 对 于 数据 始终 以 32 
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位 形式 保存 在 系统 存储 器 中 的 真正 32 位 系统 ， 字 节 顺 序 没有 什么 实际 意 
义 ， 但 是 对 于 要 将 字 节 或 16 位 半 字 映射 到 系统 存储 器 中 32 位 字 的 系统 ， 
字 节 顺序 不 匹配 就 会 影响 数据 完整 性 。 

字 节 顺序 结构 有 两 种 类 型 ， 大 端 模式 ( Big Endian，BE) 和 小 端 模式 
(Little Endian，LE)。 大 端 模式 将 MSB 保存 在 最 低 存储 器 地 址 处 。 小 端 模 
式 将 LSB 保存 在 最 低 存 储 器 地 址 处 。 多 字 节 数据 的 最 低 存储 器 地 址 可 以 认 
为 是 数据 的 起 始 地 址 。 表 7. 1 是 分 别 按 大 端 模式 和 小 端 模 式 保 存在 存储 器 
中 的 32 位 十 六 进 制 数 0xAABBCCDD。“ 字 节 0” 表 示 最 低 存 储 骨 地址 。 


表 7.1 大 端 和 小 端 字 节 顺序 








字 节 顺序 结构 字 节 0 字 节 1 字 节 2 字 节 3 
大 端 AA (MSB) BB CC DD (LSB) 
小 端 DD (LSB) tC BB AA (MSB) 


注意 ， 在 按 原生 数据 类 型 (如 32 位 ) 引用 数据 时 ， 两 种 字 节 顺序 所 
存储 的 多 字 节 数据 域 是 相同 的 。 但 在 按 字 节 或 半 字 类 型 访问 数据 时 ， 字 域 
次 序 与 系统 的 字 节 顺序 配置 相关 。 如 果 程 序 将 表 7. 1 中 的 各 字 以 字 的 形式 
保存 在 0x100 位 置 ， 并 按 独立 字 节 形式 取 数 ， 就 可 能 存在 两 种 次 序 。 

在 小 端 模式 系统 中 ， 数 据 字 节 的 顺序 如 表 7. 2 所 示 。 








表 7.2 小 端 取 址 
地 址 数 据 
0x0100 DD 
0x0101 CC 
0x0102 BB 
0x0103 AA 


注意 ， 该 字 最 右边 的 字 节 作为 第 一 个 字 节 保存 在 存储 器 中 0x100 的 位 
置 。 这 就 是 这 种 格式 称 为 小 端 模式 的 原因 ; 字 的 最 低 有 效 字 节 占据 了 存储 
器 中 该 字 的 最 低 字 节 地 址 。 

如 果 程 序 在 大 端 模 式 系统 中 执行 ， 表 7. 1 中 的 字 在 存储 器 中 的 字 次 顺 
序 如 表 7.3 所 示 。 

表 7. 3 大 端 取 址 
地 址 数 据 
0x0100 AA 
0x0101 BB 
0x0102 [em 
0x0103 DD 


7.3 ”小 端 模式 或 大 端 模式 : 哪个 更 好 * 149 


字 的 最 低 有 效 字 节 保存 在 高 阶 字 节 地 址 上 。 最 高 有 效 字 节 保存 在 低 阶 
字 节 地 址 上 ， 因 此 这 种 格式 称 为 大 端 模式 。 

在 以 半 字 方式 处 理 时 ， 存 储 器 地 址 必须 是 2 的 倍数 。 因 此 表 7. 1 中 的 
值 对 应 两 个 半 字 地 址 : 0x100 和 0x102。 表 7.4 是 在 这 种 情况 下 全 部 字 节 顺 





序 的 配置 方式 : 
表 7.4 半 字 字 节 顺序 
地 ” 址 小 ” 端 大 端 
0x0100 CCDD AABB 
0x0102 AABB CCDD 
加 注意 


在 半 字 中 ， 字 节 保 持 与 在 字 中 一 样 的 次 序 。 在 小 端 模式 中 ， 最 低 有 效 
半 字 保存 在 低位 地 址 (0x100) 中 ， 且 最 高 有 效 半 字 保 存在 高 位 地 址 
(0x102) 中 。 对 大 端 情况 ， 分 配方 式 正好 相反 。 


通常 字 节 顺序 对 程序 员 和 用 户 是 透明 的 。 但 是 ， 在 数据 必须 跨越 字 节 
顺序 模式 时 往往 会 带 来 麻烦 。 


7. 3 小 端 模式 或 大 端 模式 : 哪个 更 好 


你 可 能 遇 到 过 很 多 关于 两 种 格式 优 劣 的 争论 ， 最 多 的 争论 发 生 在 PC 
和 Mac 相对 的 优 劣 上 ; 实际 上 两 种 格式 都 有 其 各 自 的 优 缺点 。 

在 “小 端 ” 模 式 中 ， 因 为 最 低位 字 节 偏 移 值 为 “0”， 并 首先 访问 ， 访 
问 1、2、4 或 更 长 字 节 数 的 汇编 语言 指令 能 按 同样 方式 处 理 所 有 格式 。 同 
样 ， 由 于 地 址 偏 移 量 和 字 节 数 之 间 1: 1 的 关系 〈 偏 移 0 对 应 字 节 0) ， 多 精 
度 的 数学 程序 也 相对 容易 编写 。 

在 “大 端 ” 模 式 中 ， 因 为 先 访问 高 阶 字 节 ， 所 以 很 容易 通过 查看 偏 移 
量 为 0 的 字 节 来 判断 数值 的 正 负 。 所 以 无 须 接 收 所 有 字 节 包 就 能 知道 符号 
信息 。 由 于 数字 同时 也 以 其 打印 出 来 的 次 序 保存 ， 所 以 对 从 二 进 制 转化 为 
十 进 制 的 程序 特别 有 效 。 

让 我 们 看 看 在 存储 器 中 以 不 同形 式 的 格式 保存 的 十 六 进 制 数 0x12345678。 
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地 址 00 01 02 03 
大 端 模式 1i2 34 56 78 
小 端 模式 78 56 34 12 


可 以 看 出 以 大 端 模式 读 取 和 转 储 十 六 进 制 数 很 容易 ， 因 为 通常 从 左 向 


右 读 一 个 数 〈 从 较 低地 址 到 较 高 地 址 ) 。 


大 多 数位 图 图 像 (显示 和 内 存 安排 ) 映射 成 “MSB 在 左 侧 ” 的 方案 ， 


这 可 以 使 体系 结构 能 够 自然 地 移动 和 存储 大 于 一 个 字 节 的 图 像 元 素 。 小 端 
模式 的 性 能 在 这 种 情况 下 处 于 劣势 ， 因 为 在 处 理 大 型 图 像 元 素 时 需要 将 字 
节 次 序 反 向 。 


表 7.5 列 出 了 一 些 流行 的 计算 机 系统 的 字 节 顺序 结构 。 注 意 ， 某 些 


CPU 可 以 通过 设置 处 理 器 寄存 器 而 在 大 端 或 小 端 模式 〈 双 字 节 顺序 ) 间 





切换 。 
表 7.5 计算 机 系统 的 字 节 顺序 
处 理 器 字 节 顺序 体系 结构 
ARM 双 字 节 顺 序 
IBM Power PC 双 字 节 顺 序 
Intel @ 80x86 小 端 模式 
Intel ®@ Itanium ®@ processor family 双 字 节 顺 序 
Motorola 68 K 大 端 模式 


大 多 数 戏 和 人 式 通信 处 理 器 和 定制 解决 方案 在 数据 层 采 用 大 端 模式 
( 即 ，PowerPC、SPARC 等 ) 。 因 为 为 这 些 处 理 器 所 写 的 老 程 序 通常 遵循 网 
络 字 节 顺序 〈 大 端 模式 ) 。 


常用 文件 格式 和 其 字 节 顺序 如 表 7.6 所 示 : 


表 7.6 通用 文件 格式 及 其 字 节 顺序 


文件 格式 
Adobe photoshop 


BMP (Windows and OS/2 Bitmaps) 


GIF 

JPEG 

PCX (PC Paintbrush) 

QT™ (Quicktime Movies) 
Microsoft RIFF (. WAV &. AVI) 
Microsoft RTF (Rich Text Format) 
SGI (Silicon Graphics) 

TIFF 

XWD (X Window Dump) 


字 节 顺序 格式 
大 端 模 式 
小 端 模式 
小 端 模式 
大 端 模 式 
小 端 模式 
小 端 模式 
双 字 节 顺 序 
小 端 模式 
大 端 模式 
双 字 节 顺 序 
双 字 节 顺 序 
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这 意味 着 在 将 数字 写 人 文件 时 ， 需 要 知道 文件 结构 是 怎样 的 ， 例 如 ， 
如 果 在 “大 端 模 式 ”的 机 器 上 写 人 图 像 文 件 (如 BMP 文件 ) ， 首 先 要 将 字 
节 顺 序 反 转 ， 和 否则 “标准 的 ”程序 在 读 该 文件 时 会 无 法 工作 。 

Windows 的 . BMP 在 所 有 平台 上 坚持 使 用 “小 端 模 式 ” 的 格式 ， 因 为 
它 是 在 “小 端 模式 ”体系 结构 上 开发 的 。 

此 外 注意 ， 某 些 CPU 可 以 通过 设置 处 理 器 的 控制 寄存 器 切换 为 大 端 或 
小 端 ( 双 字 节 顺序 ) 模式 。 


7.4 处 理 字 节 顺序 不 匹配 的 问题 


在 单个 系统 中 字 节 顺序 不 会 产生 什么 问题 。 只 有 在 两 台电 脑 通信 时 它 
才 会 产生 影响 。 每 个 处 理 器 和 每 种 通信 协议 必须 选择 一 种 字 节 顺序 。 因 
此 ， 如 果 需 要 通过 存储 器 通信 ， 两 种 不 同 字 节 顺序 类 型 的 处 理 器 就 会 产生 
冲突 。 类 似 地 ， 小 端 模式 处 理 器 在 试图 访问 大 端 模式 网 络 时 需要 用 软件 对 
字 节 重新 排序 。 

如 果 计 算 机 无 意 间 从 共享 存储 器 区 域 或 文件 中 读 取 以 相反 格式 写 人 的 
二 进 制 数据 时 ， 字 节 顺 序 的 差异 就 会 导致 问题 。 

另外 一 个 字 节 顺序 会 导致 问题 的 领域 是 网 络 通信 。 由 于 在 同一 网 络 中 
可 能 存在 不 同类 型 (大 端 模式 和 小 端 模式 ) 的 处 理 器 ， 它 们 之 间 必 须 彼 此 
通信 。 因 此 网 络 协议 栈 和 通信 协议 也 必须 定义 字 节 顺序 。 和 否则 ， 不 同 字 节 
顺序 的 两 个 节点 可 能 无 法 通信 。 这 是 幅 入 式 程序 员 更 常 面 对 的 情况 。 

事实 上 ，TCP/IP 族 中 的 所 有 协议 层 都 定义 为 大 端 模式 。 也 就 是 说 ,各 
层 头 中 的 16 或 32 位 值 (如 下 地 址 、 包 长 度 或 校 验 和 ) 必须 首先 发 送 或 接 
收 最 高 有 效 字 节 。 

比如 ， 你 想 与 人 P 地 址 为 192. 0.1.7 的 计算 机 建立 TCP 套 接 字 连 接 。 
IPv4 使 用 32 位 整数 来 识别 网 络 中 各 主机 。 以 上 带 点 的 全 地 址 必须 转化 为 
这 样 的 一 个 整数 。 

TCP/IP 协议 所 使 用 的 多 字 节 整数 表达 方式 有 时 称 为 “网 络 字 节 顺 
序 ”。 即 使 各 终端 计算 机 都 是 小 端 模 式 的 ， 它 们 之 间 所 传输 的 数据 必须 在 
通过 网 络 前 先 转化 为 网 络 字 节 顺序 ， 然 后 在 接收 端 再 转化 为 小 端 模式 。 

假设 一 台 基 于 80x86 的 小 端 模式 PC 与 基于 SPARC 的 大 端 服务 器 通过 
互联 网 通信 。 在 没有 进一步 操作 的 情况 下 ，8086 处 理 器 将 192. 0. 1.7 转化 
为 小 端 模式 整数 0x070100c0， 并 按 下 列 次 序 传输 : 0x07，0x01，0x00， 
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0xc0。SPARC 将 按 下 列 次 序 接收 数据 : 0x07，0x01，0x00，0xc0， 并 将 按 
大 端 模 式 重建 整数 0x070100c0 ， 并 将 地 址 误 译 成 7.1.0.192 [7]。 

阻止 这 种 混乱 的 发 生 使 得 TCP/IP 协议 栈 开 发 者 需要 处 理 令 人 厌烦 的 
小 细节 的 实现 。 如 果 栈 在 小 端 模式 处 理 器 上 和 运行， 就 需要 在 运行 时 对 各 层 
头 中 每 个 多 字 节 数据 域 重 新 排序 。 如 果 栈 在 大 端 模式 机 器 上 运行 ， 就 没有 
什么 需要 担心 的 了 。 对 可 移植 的 协议 栈 〈 即 ， 能 在 两 种 处 理 器 上 和 运行) ， 
需要 能 对 是 否 进行 重新 排序 做 出 判断 。 通 常 在 编译 时 进行 该 判断 。 

另 一 个 好 例子 是 对 设备 进行 闪存 编程 。 大 多 数 常见 的 闪存 存储 器 是 8 或 16 
位 宽 的 。 大 多 数 32 位 闪存 存储 器 实际 上 要 求 两 个 交错 的 16 位 设备 。 对 这 些 设 
备 的 编程 操作 涉及 对 各 器 件 特定 地 址 的 8 或 16 位 数据 写 操作 。 因 此 ， 软 件 工 程 
师 必 须知 道 和 理解 硬件 的 字 节 顺序 配置 ， 以 便 能 成 功 对 闪存 器 件 编程 。 

在 处 理 器 从 8 或 16 位 闪存 设备 中 直接 执行 代码 时 ， 这 些 代码 应 该 保存 成 
能 被 处 理 器 直接 识别 的 形式 。 这 会 受到 系统 字 节 顺序 配置 的 影响 。 编 译 器 通常 
包含 控制 代码 镜像 的 字 节 顺序 的 开关 ， 以 能 把 它 正 确 编程 到 闪存 设备 中 。 


7.5 访问 32 位 存储 器 


下 面 的 例子 是 对 8 位 、16 位 和 32 位 存储 器 的 访问 。 
字 节 地 址 和 32 位 数据 总 线 上 特定 位 的 关系 如 表 7.7 所 示 。 
表 7.7 不 同 字 节 顺序 系统 的 地 址 数据 映射 


地 址 [1: 0] 大 端 (BE) 小 端 (LE) 
“00” Data [31: 24] Data [7: 0] 
xin Data [23: 16] Data [15: 8] 
“10” Data [15: 8] Data [23: 16] 
a Data [7: 0] Data [31: 24] 


表 7.8 为 按 8 位 、16 位 和 32 位 访问 大 端 与 小 端 模式 系统 时 的 数据 字 
节 映 射 。 
表 7.8 使 用 8、16 和 32 位 访问 格式 的 不 同 字 节 顺 序 系统 的 地 址 数据 映射 


数据 [31: 24]| 数 据 [23: 16]| 数 据 [15: 8] | 数据 [7: 0] 
0A 0B 


0C 












数据 [31: 0] 
字 节 地 址 (BE) 

字 节 地 址 (LE) 

32 位 读 操 作 

地 址 “00”(BE) 处 的 32 位 读 操作 
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( 续 ) 





0B 0C 





地 址 “00”(LE) 处 的 32 位 读 操作 oD 


16 位 读 操作 
地 址 “00”(BE) 处 的 16 位 读 操作 0A 0B 学 谓 
地 址 “00”(LE) 处 的 16 位 读 操作 0C 0 
地 址 “10”(BE) 处 的 16 位 读 操作 一 一 0C oD 
地 址 “10”(LE) 处 的 16 位 读 操作 0A 0B 二 
8 位 读 操作 
地 址 “00”(BE) 处 的 8 位 读 操 作 0A Si 和 人 
地 址 “00”(LE) 处 的 8 位 读 操作 3 i = 0D 
地 址 “01”(BE) 处 的 8 位 读 操作 = 0B > 
地 址 “01”(LE) 处 的 8 位 读 操作 二 0C 寺 
地 址 “10”(BE) 处 的 8 位 读 操 作 0C 汀 
地 址 “10”(LE) 处 的 8 位 读 操 作 ~ 0B 可 
地 址 “11”(BE) 处 的 8 位 读 操 作 
地 址 “11”(LE) 处 的 8 位 读 操作 
























7.6 处 理 字 节 顺 序 不 匹配 


在 包含 若干 PP 的 片上 系统 (SoC) 中 必然 会 发 生字 节 顺 序 不 匹配 的 问 
题 ， 几 乎 所 有 第 三 方 公司 的 他 都 支持 与 处 理 器 同样 的 字 节 顺序 类 型 。 处 理 
字 节 顺序 不 匹配 间 题 的 最 简单 方法 是 为 系统 选择 一 种 “ 字 节 顺序 类 型 ” 
( 即 ， 小 端 模式 或 大 端 模式 ) ， 并 将 全 部 其 他 不 同 字 节 顺 序 的 模块 转化 为 目 
标 “ 字 节 顺 序 类 型 ”。 

典型 的 字 节 顺序 类 型 由 系统 中 CPU 体系 结构 的 实现 决定 ， 所 以 强烈 推 
荐 目标 的 “ 字 节 顺序 类 型 ”与 处 理 器 的 字 节 顺序 类 型 相 匹 配 。 在 对 第 三 方 
IP 选 型 时 要 考虑 的 另 一 个 因素 是 确认 其 是 否 支 持 “ 双 字 节 顺序 ”结构 ， 以 
使 下 可 以 方便 地 编程 为 “大 端 模式 ”或 “小 端 模 式 ” 以 与 系统 无 缝 集成。 
对 于 不 满足 这 些 要 求 的 情况 ， 必 须 使 用 本 节 提 到 的 技术 之 一 来 解决 字 节 顺 
序 冲突 的 问题 。 万 一 没有 可 编程 选项 ， 就 需要 在 将 卫 集成 到 SoC 的 过 程 中 
解决 字 节 顺序 不 匹配 问题 。 

有 两 种 连接 相反 字 节 顺序 外 设 的 方法 。 根 据 应 用 的 需要 ， 要么 选择 将 
地 址 保持 稳定 〈 即 ， 在 地 址 不 变 处 字 节 保持 在 同一 地 址 ) 或 者 将 位 顺序 保 
持 稳定 〈 在 数据 不 变 处 地 址 改变 ) 。 
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Vs 


保持 数据 完整 性 (数据 不 变 ) 


在 SoC 的 内 核 或 二 对 单个 或 多 字 节 域 进 行 操作 时 ， 域 左边 为 MSB, 右 
边 为 LSB。 即 如 果 用 16 位 域 表 示 整 数 并 进行 加 操作 ， 会 对 LSB 加 1， 并 且 
所 有 进位 从 LSB (在 右边 ) 向 MSB (在 左边 ) 进行 。 该 操作 对 大 端 或 小 端 
地 址 体系 结构 是 相同 的 。 

这 样 产 生 的 主要 问题 之 一 是 如 何 将 内 核 和 其 他 不 同 字 节 顺序 地 址 体系 
结构 的 全 混合 使 用 。 由 于 不 同 的 字 节 顺序 模式 下 多 字 节 域 具 有 不 同 的 字 节 
地 址 ， 因 此 ， 如 果 将 多 字 节 域 作 为 单个 条 目 进行 操作 ,那么 当 其 在 各 下 之 
间 移 动 时 ， 必 须 保留 该 条 目的 位 次 序 。 

对 于 有 跨 字 节 边界 的 多 位 域 也 同样 如 此 。 比 如 ， 一 个 含 16 位 控制 寄存 
器 编程 模型 的 卫 。 如 果 控 制 寄存 器 位 域 [8: 7] 定义 了 控制 域 ,那么 要 求 
对 于 所 有 访问 控制 寄存 器 的 操作 ， 要 保持 该 16 位 之 间 的 稳定 关系 ， 而 不 
再 与 字 节 顺序 有 关 。 

为 了 理解 匹配 字 节 顺序 以 使 数据 位 顺序 完整 这 样 一 个 过 程 ， 考 虑 由 小 
端 模式 的 外 设 接收 连续 帧 并 将 接收 到 的 数据 通过 DMAZCPU 保存 到 系统 存 
储 器 这 样 一 个 例子 ， 这 里 存储 器 〈 系 统 RAM) 和 CPUZDMA 都 是 大 端 模 
式 。 如 图 7. 1 所 示 ， 首 先 接收 到 连续 帧 的 头 部 ， 然 后 是 帧 的 其 余部 分 。 


























(小 端 ) 


图 7.1 从 小 端 外 设 到 系统 存储 器 的 数据 流 (地 址 变化 ) 
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接收 到 的 连续 帧 以 “Type”“H”“HL” 和 “H0” 的 顺序 保存 在 外 设 存 
储 器 中 。 帧 中 的 域 可 能 跨 多 个 字 节 并 不 在 字 节 边界 处 终止 〈 见 图 7.2)。 例 如 ， 
状态 域 可 能 是 12 位 。 所 以 对 于 应 用 程序 来 说 ， 数 据 不 会 因为 字 节 顺序 转换 而 
改变 就 显得 很 重要 ， 因 为 这 样 软件 就 可 以 以 该 顺序 处 理 数据 了 。 


HO Hl H2 Type SO0 S1 


i 
] 字 节 |。 2 字 节 xX 字 节 要 
3 《例如 10 字 节 ) 字 节 


串 行 数据 按 字 节 
依次 存储 


| ma3 | ma2 ba | n | | > | ma | 2 | ma | 














外 设 接口 存储 器 〈 小 端 ) 系统 存储 器 (大 端 ) 
图 7.2 使 用 数据 不 变性 将 小 端 存储 器 连接 到 大 端 存储 器 上 


在 图 7.2 中 ,数据 按 小 端 寻 址 保存 在 外 设 的 存储 器 中 。 现 在 当 数 据 要 
传送 到 大 端 模式 的 系统 RAM 中 时 ， 必 须 保 证 数据 位 顺序 保持 不 变 。 为 了 
用 硬件 达到 这 个 目的 ， 需 要 对 访问 外 设 RAM 的 存储 器 的 地 址 进行 修改 。 
对 地 址 的 改动 基于 要 传送 数据 的 大 小 ， 如 表 7.9 所 示 。 

表 7.9 用 以 匹配 字 节 顺序 的 地 址 变化 





转换 大 小 小 端 地 址 映射 后 的 大 端 地 址 
8 位 0x0003 0x0000 
0x0002 0x0001 
0x0001 0x0002 


0x0000 0x0003 
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( 续 ) 
转换 大 小 小 端 地 址 映射 后 的 大 端 地 址 
16 位 0x0002 0x0000 
0x0000 0x0002 
32 位 0x0000 0x0000 


使 用 上 面 的 逻辑 ， 对 地 址 总 线 最 后 两 个 LSB 取 反 ， 数据 数据 不 变 。 
图 7. 3 为 对 应 的 HDL 代码 。 





图 7.3 使 用 数据 不 变性 对 字 节 顺序 匹配 的 代码 


使 用 上 面 的 方案 可 以 使 字 节 顺序 转换 对 软件 透明 ， 并 能 确保 数据 完整 
性 在 字 节 顺序 转换 过 程 中 不 会 被 破坏 。 

数据 流 

从 小 端 设 备 到 大 端 存 储 器 ， 并 保持 数据 不 变 的 数据 流 如 下 所 述 。 

1) DMA 发 出 对 外 设 存储 器 的 读 字 节 操作 。 

2) 让 我 们 举 个 例子 ， 其 中 系统 产生 的 地 址 为 0x00。 在 数据 变化 的 实 
现 中 ， 小 端 模式 设备 RAM 所 看 到 的 地 址 为 0x03。 

3) 设备 存储 器 对 该 地 址 解码 ， 访 问 位 31: 24 或 者 如 图 7.3 所 示 的 
“Type” 域 。 

4) 外 设 输出 该 值 为 | “Type”,“0x000000”} (32 位 输出 ) 。 

5) DMA 对 系统 的 大 端 存储 器 发 出 按 字 节 方式 的 写 操作 。 

6) 再 次 产生 0x00 地 址 〈 字 节 访 问 ) 。 

7) 大 端 存储 器 将 该 访问 解码 为 写 人 位 31: 24。 

8) 由 于 来 自 于 小 端 存储 器 的 数据 处 于 同样 的 字 节 区 域 ， 因 此 可 以 保 
持 数据 的 完整 性 并 将 数据 保存 在 大 端 RAM 中 。 

9) 对 其 他 需要 从 外 设 RAM 传输 到 系统 RAM 中 的 数据 继续 进行 该 操作 。 

10) 16 位 和 32 位 访问 过 程 与 上 面 所 述 相 同 ， 只 是 地 址 需要 加 以 改变 ， 
如 表 7. 9 所 示 。 


7. 6.2 ”地 址 不 变 
与 数据 不 变 的 字 节 上 顺序 转换 相 比 ， 某 些 应 用 程序 或 系统 不 需要 数据 保 


7.6 ”处理 字 节 顺 序 不 匹配 多 


持 特定 的 次 序 ， 但 是 需要 在 字 节 顺序 转换 后 数据 字 节 保持 在 同样 的 地 址 区 
域 。 这 时 就 需要 使 用 地 址 不 变 的 字 节 顺序 转换 。 

参考 同一 个 接收 连续 帧 的 例子 ,对 于 地 址 不 变 的 系统 ,访问 字 节 
“Type” 的 地 址 偏 移 量 永远 是 0x3。 而 在 前 一 节 中 ,访问 该 字 节 需要 使 用 不 
同 的 地 址 偏 移 量 。 为 了 用 硬件 实现 该 过 程 ， 需 要 修改 或 交换 从 外 设 RAM 
存储 器 中 读 到 的 数据 值 。 数 据 的 修改 如 图 7.4 所 示 。 





图 7.4 使 用 地 址 不 变性 匹配 字 节 顺序 


地 址 不 变 的 字 节 顺序 转换 如 图 7.5 所 示 。 






























































HO Hl H2 e_ S0 Sl 
I CRC 
头 部 类 型 状态 有 效 负载 位 校 验 | 
1 字 节 2 字 节 X 字 节 2 
半天 (例如 10 字 节 字 地 ”| 
串 行 数据 按 字 节 
依次 存储 
n+3 |n+2 |n+l | n | n n+l n+2 n+3 
0 Type | H2 Hl HO 0 HO Hl H2 | Type 
网 RE 
4 D1 DO sl S0 4 S0 S1 | D0 Bl 
-一 一 | 
8 D5 D4 D3 D2 Es 8 同 ， D3 D4 D5 
| 
© D9 D8 o | D6 [ 侧 D6 D7 D8 D9 
| 
10 [ee 10 【ER 
31 0 31 0 
外 设 接口 存储 器 (小 端 ) 系统 存储 器 (大 端 ) 


图 7.5 使 用 地 址 不 变性 将 小 端 存储 器 连接 到 大 端 存储 器 上 
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数据 流 

使 用 地 址 不 变 方式 ， 从 小 端 外 设 到 大 端 存储 器 的 数据 流 如 下 所 述 。 

1) DMA 发 出 对 外 设 存储 器 的 读 字 节 操作 。 

2) 让 我 们 举 个 例子 ， 其 中 系统 产生 的 地 址 为 0x00。 地 址 不 变 的 实现 
使 地 址 值 始终 相同 。 

3) 外 设 RAM 对 该 地 址 解码 ,访问 位 7: 0 或 “HO” 区 域 ， 如 图 7.5 
所 示 。 

4) 外 设 输出 的 数据 为 | “0x000000”,“H0”} (32 位 输出 ) 。 由 于 字 
节 顺 序 匹 配 时 地 址 不 变 ， 给 系统 RAM 的 数据 变 为 |“H0O”,“0x000000”| 。 

5) DMA 发 出 对 系统 大 端 存储 器 的 字 节 写 操 作 。 

6) 再 次 产生 地 址 0x00 ( 字 节 访问 ) 。 

7) 大 端 存储 器 将 该 访问 解码 为 写 人 位 31: 24. 

8) 在 字 节 顺序 转换 完成 后 ， 从 小 端 存储 器 读 出 的 数据 已 处 在 同样 的 
地 址 区 域 ， 把 数据 存 人 大 端 RAM。 

9) 对 其 他 需要 从 外 设 RAM 传递 到 系统 RAM 的 字 节 继续 进行 以 上 
操作 。 

10) 对 16 位 或 32 位 的 访问 ， 上 述 操作 过 程 是 相同 的 ， 只 需 按 表 7.9 
所 示 的 方式 将 输出 数据 进行 交换 即 可 。 


7. 6.3 软件 字 节 交换 


交换 汇编 指令 


交换 字 节 是 实现 字 节 顺序 转换 的 一 种 方式 。 在 由 应 用 程序 本 身 决 定 字 
节 顺 序 的 系统 中 ， 该 模式 是 有 用 的 。 因 此 ， 无须 用 硬件 实现 这 种 字 节 顺序 
匹配 过 程 。 字 节 顺 序 中 性 代码 的 字 节 交换 方法 使 用 字 节 交换 控制 来 决定 是 
否 必须 进行 字 节 交换 过 程 。 

方法 

在 软件 中 通常 使 用 的 各 种 字 节 交换 方法 有 : 

。 交换 汇编 指令 

。 用 于 交换 字 节 的 软件 库 宏 

。 协议 特定 的 交换 函数 

。 制定 的 交换 函数 


某 些微 控制 器 的 指令 集 包 含 预定 义 的 交换 函数 ， 软 件 可 直接 使 用 于 实 


7.8 字 节 顺序 中 性 编码 指南 9 159 


现 针对 特定 应 用 的 字 节 顺序 转换 。 


交换 库 宏 


某 些 软 件 程 序 语言 同样 提供 了 内 置 宏 以 在 应 用 中 对 字 节 顺序 转换 实现 
字 节 交换 。 
协议 特定 宏 
所 有 通信 协议 必须 定义 协议 的 字 节 顺序 ， 以 使 两 端 节点 知道 如 何 通 
信 。 像 TCP/IP 这 样 的 协议 ， 将 网 络 字 节 顺序 定义 为 大 端 模式 ， 且 TCP/IP 
包 的 下 头 包含 几 个 多 字 节 域 。 小 端 模式 体系 结构 的 计算 机 在 传输 数据 之 


前 ， 必 须 将 TCP/IP 头 信息 中 的 字 节 重新 排序 为 大 端 模 式 ， 类 似 地 ， 需 要 
将 接收 到 的 TCP/IP 信息 重 排序 为 小 端 格式 。 


限制 


在 软件 中 实现 交换 功能 会 增加 额外 开支 。 位 交换 所 引起 的 软件 开支 虽 
然 存在 ,但 是 在 需要 处 理 的 包 的 数量 很 多 时 开支 引起 的 问题 很 容易 修复 ， 
特别 是 在 高 频 处 理 器 中 。 


7.7 字 节 顺序 中 性 代码 


避免 由 字 节 顺序 所 引发 问题 的 最 好 方式 是 在 设计 中 使 用 字 节 顺序 中 
性 。 可 以 通过 两 种 途径 完成 这 一 任务 : 

。 将 字 节 顺序 选项 作为 软件 可 配置 的 选项 。 

。 在 设计 (JP) 中 使 用 字 节 使 能 ， 并 将 解码 的 任务 留 给 系统 或 SoC。 


7.8 字 节 顺序 中 性 编码 指南 


字 节 顺序 中 性 代码 可 以 通过 标识 外 部 软件 接口 实现 ， 遵 循 下 面 的 指南 
来 访问 这 种 接口 。 

1) 数据 存储 和 共享 存储 体 一 一 数据 必须 以 独立 于 字 节 顺序 体系 结构 
的 格式 保存 。 

可 通过 使 用 文本 文件 或 指定 仅 用 来 保存 数据 的 字 节 顺序 格式 (以 使 数 
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简介 


第 8 章 


消 拌 技术 


在 电子 设备 内 两 个 金属 触 点 随 着 触 点 的 断 开 闭 合 便 产 生 了 多 个 信和 号， 
这 就 是 抖动 。“ 消 抖 ”是 用 以 确保 在 每 一 次 断 开 或 闭合 触 点 时 只 有 一 个 信 
号 起 作用 的 硬件 设备 或 软件 。 

机 械 开 关 和 继电器 触 点 通常 由 弹性 金属 制造 ， 由 传动 装置 强制 接触 。 
当 触 点 撞击 在 一 起 时 ， 它 们 的 惯性 和 弹性 共同 作用 形成 抖动 ， 导 致 产生 一 
个 快速 的 脉冲 电流 而 不 是 从 零 电流 到 全 电流 的 平稳 转换 。 开 关 和 线路 中 的 
寄生 电感 与 电容 进一步 引起 波形 改变 ， 形 成 一 系列 衰减 正弦 振荡 。 这 个 影 
响 在 交流 电源 线路 中 不 明显 ， 因 为 抖动 太 快 不 至 于 影响 大 多 数 设备 。 但 在 
某 些 模拟 和 膛 辑 电路 中 可 能 产生 问题 ， 因 为 这 些 电 路 反应 太 快 会 将 开关 脉 
冲 误 当 作 数 据 流 。 

时 序 逻 辑 数字 电路 特别 容易 受到 触 点 拌 动 的 影响 。 开 关 拌 动产 生 的 电 
压 波 形 干 扰 正 常 逻 辑 电 路 的 振幅 和 时 序 规格 要 求 。 结 果 是 亚 稳 定性 、 竞 
争 、 小 脉冲 和 故障 等 问题 导致 电路 失效 。 

当 按 下 计算 机 键盘 的 一 个 键 时 ， 期 待 计算 机 记录 下 一 个 单 触 点 。 然 
而 ， 事 实 上 ， 第 一 次 接触 时 ， 会 有 轻微 抖动 或 接触 接 通 ， 拌 动 结束 时 会 有 
另 一 个 接触 ， 然 后 再 产生 拌 动 ， 如 此 类 推 。 通 常 这 些 产品 使 用 薄膜 开关 ， 
尖端 为 导电 的 橡胶 材料 。 按 下 去 时 与 电路 板 上 裸露 的 触 点 接触 。 由 于 橡胶 
是 柔软 的 ， 因 此 软 接 触 几 乎 不 产生 抖动 。 主 要 问题 是 大 多 数 这 类 解决 方案 
对 高 冲击 力 等 不 是 很 有 效 。 
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本 章 详 述 了 消 拌 技术 设计 依据 指南 ， 目 的 在 于 实现 平滑 无 抖动 


开关 。 
8.2 开关 行为 
图 8. 1 展示 了 一 个 带 有 上 拉 电 阻 的 简单 按键 开关 。 图 8.2 展示 了 当 按 
键 压 下 和 释放 时 相应 的 输出 。 
VCC《〈 逻 辑 1) 
Rl1 
输出 


H 


a (逻辑 0) 


图 8.1 带 有 上 拉 电 阻 的 按键 开关 


拌 动 周期 抖动 周期 


| i 
逻辑 1 
逻辑 0 
1 t 
激活 开关 未 激活 开关 


图 8.2 ”开关 激活 或 不 激活 时 的 抖动 周期 


如 果 开 关 是 用 于 开 灯 或 启动 风扇 马达 ， 则 触 点 抖动 不 是 什么 问题 。 如 
果 开 关 或 继电器 用 作 数 字 计时 器 、 个 人 计算 机 或 微 处 理 器 等 设备 的 输入 ， 
由 于 触 点 抖动 则 会 产生 问题 。 计 数 器 将 会 出 现 多 次 计数 而 不 是 一 次 计数 。 
在 开关 释放 时 也 会 出 现 同样 问题 。 
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关注 这 个 问题 的 原因 是 触 点 停止 拌 动 所 花 的 时 间 通 常 大 约 是 毫秒 级 
的 ， 数 字 电路 能 在 毫秒 甚至 更 快 时 间 〈 纳 秒 ) 内 响应 。 

通常 的 解决 方案 是 消 抖 设备 或 软件 可 以 确保 在 一 个 给 定时 间 内 (通常 
为 毫秒 级 ) 仅 有 唯一 数字 信号 记录 。 在 跳 转 到 各 种 开关 消 拌 解决 方案 前 ， 
我 们 先 了 解 开关 和 抖动 周期 。 


8. 3 开关 种 类 


最 简单 的 开关 类 型 是 将 两 个 电导 体 通过 传动 机 构 的 运动 联系 在 一 起 。 
其 他 开关 更 复杂 ,包括 靠 物理 信号 实现 开关 的 电子 线路 〈 如 光 或 磁场 ) 。 
无 论 如 何 ， 任 何 开关 的 最 终 输 出 将 是 〈 至 少 是 ) 一 对 接线 端子 ， 它 们 或 通 
过 开关 内 部 触 点 装置 连接 在 一 起 (闭合) 或 不 连接 〈 断 开 ) 。 

图 8.3 显示 了 一 些 开关 。 


拨 动 开关 按钮 开关 温度 开关 

fi 人 -天 

压力 开关 液 位 开关 选择 开关 
图 8.3 开关 的 种 类 


拨 动 开关 是 通过 一 个 控制 杆 转 到 两 个 或 多 个 位 置 中 的 一 个 位 置 来 操纵 
的 。 家 用 电路 常用 的 灯 开 关 是 拨 动 开关 的 一 个 例子 。 

按钮 开关 是 双 位 设备 ， 通 过 按钮 的 按 下 和 释放 来 操纵 。 大 多 数 按钮 开 
关内 部 有 一 个 弹簧 机 构 ， 通 过 瞬间 操作 使 按钮 回 到 “出 来 ”或 “不 按 下 ” 
位 置 。 

温度 开关 包含 两 个 紧 挨 的 金属 薄片 ， 每 个 金属 片 有 不 同 的 热膨胀 率 。 
当 金 属 片 加 热 或 冷却 时 ， 两 片 金 属 间 的 不 同 热膨胀 率 使 它们 产生 弯曲 。 这 
样 ， 薄 片 的 弯曲 就 可 用 于 操纵 开关 触 点 装置 。 

压力 开关 使 用 气体 压力 或 液体 压力 ， 压 力 通过 活塞 、 薄 膜 或 波纹 管 变 
为 机 械 力 来 驱动 开关 。 

液 位 开关 也 可 设计 用 来 探测 固体 材料 的 水 平 ， 如 木材 、 粮 食 和 煤 
炭 等 。 

选择 开关 是 由 旋钮 或 某 种 控制 杆 来 操纵 到 两 个 或 多 个 位 置 中 的 一 个 位 
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8.4 


8. 4.1 


消 拌 


消 拌 技术 


置 。 类 似 于 拨 动 开关 ， 选 择 开关 可 能 保持 在 任意 的 通 断 位 置 或 内 置 弹簧 装 
置 回 位 。 

可 能 有 更 多 类 型 的 开关 ， 在 此 没有 一 一 列举 。 但 不 同 的 开关 运转 方式 
不 同 ， 拌 动 周期 也 不 同 。 简 单 廉价 的 开关 比 专用 开关 可 能 具有 更 大 的 拌 动 
周期 ， 例 如 ， 具 有 多 个 平行 触 点 的 开关 抖动 较 小 ， 但 开关 更 复杂 且 费 用 
高 。 有 关 开 关 设计 的 技术 和 指南 数量 众多 ， 可 用 于 减少 抖动 周期 ， 但 这 不 
在 本 书 范围 内 。 


有 几 种 办 法 可 用 于 解决 触 点 拌 动 问题 〈 即 输入 信号 “ 消 抖 ") 。 本 节 
提出 硬件 和 软件 的 解决 办 法 。 


RC 消 持 


如 图 8. 4 所 示 ， 一 个 电阻 -电容 (RC) 网 路 可 能 是 最 常见 且 最 容易 的 
消 抖 电路， 就 是 把 一 个 电阻 和 电容 连接 在 一 起 ， 开 关连 接 至 中 间 。 电 容 经 
过 电阻 充电 ， 开 关 未 使 用 的 默认 状态 是 高 电 平 。 当 开关 闭合 时 ， 它 慢 慢 将 
电容 消耗 至 地 电位 ， 以 此 减弱 所 有 小 抖动 的 影响 。 这 种 电路 能 承受 某 些 持 
动 但 不 完全 消除 它们 ( 见 图 8. 5)。 


输出 


8.4 ”RC 消 拌 电路 


当 开 关 断 开 时 ， 电 容器 两 端 电压 为 0， 但 它 以 某 个 速率 开始 上 升 ， 这 
个 速率 由 R 和 C 的 值 确定 。 拌 动 接 触 使 电压 下 降 并 降低 电容 的 电荷 聚积 。 
为 了 完全 消除 抖动 需要 以 RAC 速率 缓慢 放电 。R/C 可 调节 至 某 个 值 ， 从 而 
使 得 电压 在 抖动 停止 前 一 直 低 于 门 电路 的 逻辑 1。 这 潜在 一 个 副作用 就 是 
如 果 时 间 常 数 过 大 则 开关 对 快速 “ 断 开 ”或 “闭合 ”可 能 无 法 反应 。 
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一 真实 开关 
RC 网 路 





网 Fp } » 
时 间 
图 8.5 真实 开关 与 RC 网 路 对 比 


现在 ,假设 开关 暂时 断 开 ， 电 容器 充满 电 。 用 户 合 上 开关 ， 电 容器 通 
过 R2 放电 。 电 压 又 缓慢 下 降 ， 一 段 时 间 内 门 电路 输入 保持 逻辑 1。 在 抖动 
期 间 的 一 小 段 时 间 内 ， 触 点 不 断 断 开 闭合 。 当 触 点 断 开 时 ， 时 间 即 使 很 
短 ， 两 个 电阻 就 为 电容 再 次 充电 ， 增 强 了 门 电路 的 逻辑 “1”。 选 择 合适 的 
元 件 值 以 保证 抖动 停止 前 门 电路 逻辑 保持 为 “1 ”。 

以 上 所 示 RC 电路 即使 没有 R2 ( R2 =0) ， 也 能 很 好 地 消除 任何 抖动 。 
快速 操作 开关 会 产生 次 微 秒 级 或 更 小 的 拌 动 ， 因 此 具有 更 加 快速 的 上 升 时 
间 。 更 糟糕 的 是 ， 取 决 于 元 件 的 物理 排列 ， 开 关 输 入 变 为 逻辑 “0” 时 电 
容器 两 端的 电压 可 能 仍 为 逻辑 “1”。 当 触 点 断 开 时 ， 门 电路 为 逻辑 “1”。 
导致 输出 为 一 连 串 的 “1”、“0” 拌 动 。R2 使 电容 器 慢 速 充 电 ， 忽 略 抖动 
的 频率 而 产生 干净 的 逻辑 电 平 。 电 阻 同样 限制 了 流 经 开关 触 点 的 电流 ， 防 
止 电容 器 瞬间 大 量 电 涌 烧 坏 触 点 。 

最 后 ， 开 关 的 状态 信息 实际 上 不 是 数字 的 ， 因 此 用 它 控制 类 似 于 
开关 集成 电路 的 电路 不 会 很 有 效 。 为 了 正确 地 使 用 开关 状态 信息 ， 需 
要 基本 的 模 数 转换 ， 它 由 一 个 附加 在 RC 网 路 上 的 逻辑 门 电路 组 成 ， 
如 图 8. 6 所 示 。 


输出 


8.6 具有 数字 逻辑 的 RC 网 路 
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逻辑 门 电路 有 某 个 电压 靖 值 ， 在 此 阔 值 要 改变 输出 状态 。 它 对 开关 抖 
动 提 供 某 些 容 差 ， 但 某 些 开关 抖动 可 能 会 漏网 ， 如 图 8. 7 所 示 。 





图 8.7 RC 网 路 对 比 逻 辑 输出 


逻辑 门 或 反 向 器 不 会 是 一 个 标准 的 逻辑 门 。 例 如 ，TTL 逻辑 电路 定义 
逻辑 “0” 为 0.0V ~0. 8V 的 输入 ， 逻 辑 “1” 为 高 于 2.0V 的 输入 。 介 于 
0. 8V ~2.0V 的 输出 是 不 可 预测 的 。 通 过 使 用 带 有 施 米 特 触发 器 的 逻辑 门 
电路 可 能 增加 对 抖动 的 容 差 。 有 了 施 米 特 触发 器 ， 电 压 降 至 第 一 个 靖 值 以 
触发 ,但 电压 上 升 到 相同 阐 值 ， 直 到 另 一 个 更 高 的 阅 值 前 ， 状 态 不 会 改 
变 。 施 米 特 触发 器 降低 了 对 开关 拌 动 的 灵敏 度 ， 如 图 8. 8 所 示 。 





时 间 
图 8.8 RC 网 路 对 比 逻辑 输出 ( 施 米 特 触发 器 ) 


基于 “ 施 米 特 触发 器 ”输入 的 电路 具有 滞后 现象 ， 输 入 拌 动 但 输出 保 
持 已 知 的 稳定 状态 。 
试图 对 每 个 各 种 电路 调节 RC 比例 比较 麻烦 。 我 们 提出 对 各 种 情况 有 
效 的 通用 RC 电路 。 电 容器 放电 定义 如 下 : 
es = Va (es) 
式 中 Vc = 在 时 间 上 电容 器 两 端的 电压 
aaa = 电容 器 两 端的 初始 电压 
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t= 以 秒 为 单位 的 时 间 
R= 以 欧姆 为 单位 的 电阻 值 
C= 以 法 拉 为 单位 的 电容 值 
电阻 及 和 电容 C 的 值 应 当 这 样 选择 : Ye 直到 开关 停止 抖动 始终 高 于 
使 门 电路 转换 的 阔 值 电压 。 
RI1 + 12 控制 电容 器 充电 时 间 ， 以 开关 为 条 件 设置 消 拌 周期 。 充 电 方 
程式 为 : 


Vreshoa = Vina (1 -ee ™) 


式 中 ”Viewwos = 最 坏 情况 下 电容 器 两 端 转换 点 电压 
iu = 电容 器 两 端 最 终 充电 值 
8.9 展示 了 RC 消 拌 电路 的 一 个 小 变化 ， 即 在 RI1 和 R2 间 增 加 一 
个 二 极 管 。 此 二 极 管 为 一 个 可 选 组 件 以 保持 正确 运行 ， 即 使 出 现 R1 + 
R2 值 小 于 R2 等 错误 导致 滞后 电压 呈现 不 同 值 时 也 能 正确 运行 。 在 此 
情况 下 ， 二 极 管 形成 一 个 捷径 将 R2 从 充电 线路 中 除 掉 。 所 有 电荷 从 
R1 流 过 。 


输出 


8.9 稳定 的 RC 消 拌 电路 


我 们 将 更 详细 地 分 析 这 种 情况 。 图 8. 10 展示 了 开关 分 别处 于 断 开 和 
闭合 时 的 电路 状态 。 


Va 输出 


开关 
闭合 





图 8.10 稳定 的 RC 消 拌 电 路 状态 〈 开 关 断 开 / 闭 合 位 置 ) 
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当 开 关 断 开 时 ， 电 容器 C 取道 RI 和 二 极 管 充电 ， 最 后 ， 电 容器 充电 ， 
Vb 大 约 在 Vec 以 下 0.7V 范围 内 。 因 此 反 相 施 米 特 触发 器 的 输出 为 逻辑 
“0” 

当 开关 闭合 时 ， 电 容器 取道 尼 放电 ， 最 后 电容 器 C 放电 ，Vb 到 达 
0V。 因 此 反 相 施 密 特 触发 器 的 输出 为 逻辑 “1”。 

如 果 拌 动 发 生 并 有 短 时 的 开关 断 开 或 闭合 ， 电 容器 将 阻止 Vb 直接 变 
成 ee 或 地 线 GND。 尽 管 拌 动 会 导致 电容 器 的 轻微 充电 和 放电 ， 但 假设 施 
密 特 触发 器 输入 的 滞后 现象 会 阻止 开关 输出 。 

注意 ， 要 求 电阻 到 作为 电容 器 的 放电 路 径 ， 如 果 没 有 也， 开关 闭合 
时 电容 器 会 短路 。 在 开关 断 开 时 ， 如 果 没 有 二 极 管 ，RlL 和 R& 都 将 形成 电 
容器 充电 路 径 。R1 和 到 的 组 合 将 增加 电容 器 的 充电 时 间 ， 降 低 电 路 的 速 
度 。 另 一 个 选择 是 将 电阻 R1 容量 变 小 ,但 在 开关 闭合 而 RI 连接 在 电源 线 
两 端 时 会 导致 不 必要 的 电流 浪费 。 


8. 4.2 硬件 消 抖 电路 


图 8. 11 展示 了 另 一 种 硬件 方法 。 它 使 用 了 由 一 对 与 非 门 电路 制作 的 
交叉 耦合 门 。 它 还 可 以 用 SR 双 稳 态 触发 器 设计 。 使 用 交叉 耦合 门 的 好 处 
是 它 提供 一 种 完全 的 消 拌 而 不 用 考虑 延 时 限制 ， 而 且 它 的 响应 速度 和 触 点 
断 开 和 /或 闭合 一 样 快 。 注 意 ， 电 路 要 求 触 点 正常 断 开 或 闭合 。 在 开关 中 ， 
这 种 安排 称 为 “ 双 掷 ” 。 在 继电器 中 ， 这 称 为 “形状 C”。 





8.11 SR 消 拌 电路 


当 开 关 处 于 位 置 “a” 时 ， 门 电路 “1” 的 输出 就 是 逻辑 高 (Logic 
HICH) ， 不 考虑 其 他 输入 值 。 这 使 得 门 电路 “2” 拉 到 逻辑 低 (Logic 
LOW) 。 如 果 开 关 在 触 点 间 移 动 并 不 在 这 两 点 间 的 区 域 短 暂停 止 ， 由 于 门 
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电路 “2” 将 逻辑 “0” 回 送 到 门 “1” 使 其 保持 状态 。 这 样 保 证 了 锁 存 器 
输出 为 非 抖 动 。 

接近 以 上 思想 的 软件 方法 之 一 是 将 两 个 触 点 上 拉 输 入 至 CPU 的 输入 引 
脚 ，CPU 当然 会 注意 到 许多 拌 动 ， 但 通过 编写 探测 两 个 触 点 之 一 行为 的 简 
单 代码 ， 拌 动 同样 可 消除 。 


8. 4.3 软件 消 抖 电路 


软件 开关 消 抖 可 以 很 简单 ， 尽 管 算法 的 选择 会 依赖 于 应 用 及 开关 的 操 
作 。 在 转 到 开关 消 抖 的 软件 技术 之 前 ， 了 解 这 个 问题 很 重要 。 

检查 开关 的 动态 特征 和 评估 环境 的 影响 很 重要 。 随 着 开关 的 断 开 
或 闭合 ， 所 有 开关 显示 开关 触 点 抖动 。 如 前 所 述 ， 在 触 点 完全 到 达 最 
后 位 置 前 ， 开 关 触 点 实际 上 要 多 次 相互 反弹 。 (如 果 开 关 位置 对 触摸 
人 敏感， 人们 可 以 不 经 意 地 触摸 开关 而 引起 抖动 。 开 关 制 造 商 称 这 种 不 
经 意 的 触摸 为 “ 玩 机 ”开关 )。 环 境 干 扰 包 括 振动 及 最 重要 的 电磁 干 
扰 (EMI)。 

电磁 干扰 是 一 种 有 害 的 干扰 ， 是 由 于 外 部 来 源 发 射 的 电磁 辐射 而 影响 
电路 。 这 种 干扰 会 引起 开关 内 噪声 导致 抖动 。 电 磁 干 扰 可 通过 适当 的 消 拌 
程序 来 处 理 。 

下 面 将 描述 一 些 软件 〈 或 固件 ) 的 开关 消 拌 技 术 。 

解决 方案 A: 在 足以 让 抖动 停止 的 时 间 后 读 出 开关 

开关 消 拌 的 一 个 简单 解决 方案 是 每 400 ~ 500 毫秒 读 出 开关 ， 并 设置 状 
态 标志 指示 开关 状态 。 查 看 开关 性 能 ,任何 好 的 开关 都 会 在 这 个 时 间 内 消 
除 抖动 ， 每 500 毫秒 产生 一 个 完全 的 输出 。 这 种 方法 唯一 不 好 的 是 响应 时 
间 慢 ， 如 果 开 关 操 作 时 间 快 于 500 上 毫秒 这 种 方法 会 失败 。 但 就 绝 大 多 数 情 
况 而 言 ， 这 种 方法 还 是 有 效 的 。 

上 述 简单 方法 并 不 提供 任何 EMI 保护 。 通 过 为 开关 提供 足够 的 时 间 来 
停止 拌 动 可 以 减少 绝 大 多 数 随机 噪声 脉冲 ,但 取 开 关 状 态 期 间 单一 短 时 脉 
冲 波 干扰 可 能 被 误 当 作 触 点 转换 。 为 避免 这 种 情况 ， 必 须要 修改 软件 在 每 
500 毫秒 循环 多 次 读 取 输入 ， 以 寻找 一 个 稳定 的 信号 。 这 样 就 可 拒绝 大 多 
数 EMI。 

解决 方案 B: 开关 启动 时 中 断 CPU 并 在 中 断 服务 程序 (ISR) 中 消 拌 

通常 ， 在 激活 触 点 时 ， 连 接 计 算 机 的 开关 或 继电器 会 产生 中 断 。 中 断 
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将 调用 一 个 子 程序 〈 中 断 服务 程序 ) 。 以 下 以 一 种 通用 汇编 语言 给 出 一 个 


典型 的 消 拌 程序 。 

DR : PUSH PSW 7 SAVE PROGRAM STATUS WORD 

LOOP : CALL DELAY 7 WAIT A FIXED TIME PERIOD 
IN SWITCH 7 READ SWITCH 
CMP ACTIVE 7 IS IT STILL ACTIVATED? 
JT LOOP ;? IF TRUE, JUMP BACK 
CALL DELAY 
POP PSW ; RESTORE PROGRAM STATUS 
EI 7 RE-ENABLE INTERRUPTS 
RETI 7 RETURN BACK TO MAIN 


PROGRAM 

设计 思想 是 一 旦 激活 开关 ， 就 调用 消 拌 程序 ( De-bounce Routine， 
DR) 。DR 调用 另 一 个 子 程序 一 一 DELAY， 其 作用 就 是 消耗 足够 长 的 时 
间 使 得 触 点 停止 抖动 。 此 时 DR 检查 触 点 是 否 仍 在 激活 状态 (也许 用 
户 把 手 放 在 开关 上 ) 。 如 果 处 于 激活 状态 ，DR 等 待 触 点 清 零 。 如 果 触 
点 清 零 ， 考 虑 到 在 结束 前 触 点 松 开 时 的 抖动 ，DR 再 一 次 调用 DELAY 
程序 。 

消 拌 程序 必须 调整 以 适用 于 你 的 应 用 。 该 要 点 不 可 能 永远 成 立 。 
程序 员 同 样 必须 意识 到 开关 和 继电器 随 着 使 用 年 限 增 长 将 失去 弹性 。 
这 会 使 触 点 停止 拌 动 的 时 间 增 长 。 因 此 在 键盘 办 新 时 运行 良好 的 消 拌 
代码 一 两 年 后 可 能 失灵 了 。 请 咨询 开关 制造 商 最 坏 情况 下 拌 动 时 间 的 
数据 。 

解决 方案 C: 使 用 计数 器 消除 噪声 并 验证 开关 状态 

另 一 个 想法 是 制作 一 个 计数 器 ， 在 信号 为 逻辑 低 时 计数 ， 在 信和 号 为 逻 
辑 高 时 重 置 计 数 器 。 如 果 计 数 器 到 达 某 个 固定 值 ， 该 值 应 当 比 噪声 脉冲 大 
一 至 两 倍 ， 意 味 着 电流 脉冲 为 有 效 脉 冲 。 

以 下 为 C 代码 的 一 个 样本 快照 : 


// include files 

unsigned char counter; // Variable used to count 

unsigned char T valid; // Variable used as the minimum 
// duration of a valid pulse 

void main(){ 


Pl = 255; // Initialize port 1 as input port 
Tvalid = LT00» // Arbitrary number from 0 to 255 where 
// the pulse if validated 
while(1){ // infinite loop 
if (counter < 255){ // prevent the counter to roll 


// back to 0 
counter++; 
} 


8.4 消 拌 9 171 


站 (PLD Ss LV) 
counter = 0; // reset the counter back to 0 


} 
if (counter > T valid)t 


We 
// Code to be executed when a valid 


// pulse is detected. 
as 
} 
7 
// Rest of you program goes here. 


A 


8. 4. 4 ” 消 持 指南 


前 一 节 讨论 过 各 种 消 拌 方法 ， 然 而 浪费 大 量 CPU 周期 来 解决 消 拌 问题 
并 不 是 一 个 好 主意 。 消 拌 是 一 个 小 问题 ， 只 能 占用 计算 机 一 小 部 分 资源 。 
所 以 应 当选 择 将 CPU 开销 最 小 化 的 方法 。 以 下 给 出 了 一 些 应 当 遵 守 的 指南 
以 在 电路 中 拥有 强大 的 消 拌 机 制 : 

。 与 消 拌 相关 的 CPU 开销 应 当 最 小 化 。 

。 非 消 拌 开关 必须 连接 至 已 编程 序 的 WO 引 脚 ， 绝 不 能 连接 至 CPU 
的 中 断 。 如 果 连 接 至 CPU 中 断 ， 拌 动 会 引起 多 重 中 断 ， 同 样 会 
增加 CPU 的 负担 ， 因 为 每 次 中 断 CPU 都 会 执行 中 断 服务 程序 
(ISR) 
ISR 延 时 不 能 容忍 ， 必 须 保持 ISR 的 快速 。 与 开关 状态 相关 的 中 断 
不 应 当 用 作 时 钟 或 触发 器 的 数据 信号 ， 因 为 这 会 违反 了 最 小 时 钟 
宽度 或 数据 建立 及 保持 时 间 等 原则 。 
。 开关 输入 取样 的 频率 不 应 当 与 外 界 事件 同步 ， 否 则 会 产生 周期 性 
的 EMI。 以 常用 50/60Hz 频率 的 速度 取样 应 当 避 免 。 甚 至 机 械 振动 
也 会 产生 周期 性 干扰 。 对 汽车 而 言 ， 其 至 以 发 动机 振动 或 驾驶 杆 
振动 同步 的 频率 取样 都 可 能 引发 EMI。 
系统 应 当 对 开关 (用户) 输入 立即 响应 。 万 一 开关 状态 显示 在 
LED 或 显示 器 上 ， 用 户 要 系统 迅速 响应 以 避免 显示 器 或 LED 出 现 
混乱 情况 。 
使 用 定时 器 有 规律 间隔 地 中 断 CPU 〈 例 如 ， 每 几 个 毫秒 ) ， 而 不 是 
用 延 时 〈 以 毫 秘 或 秒 为 单位 ) 来 等 待 输入 稳定 。 这 样 可 使 得 消 持 
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代码 可 移植 到 新 的 编译 器 或 CPU 中 ， 而 不 是 随 着 每 次 时 钟 频率 变 
化 或 CPU 变化 而 改变 等 待 状态 。 


8. 4.5 在 多 重 输入 下 消 拌 


在 许多 实际 情况 下 ， 一 个 系统 需要 多 组 开关 。 单 个 输入 开关 消 拌 的 方 
法 对 多 重 输入 的 单个 消 抖 没有 意义 ， 所 有 输入 开关 可 同时 处 理 而 占用 CPU 
开销 很 少 。 本 节 将 消 拌 技术 或 算法 扩展 至 多 个 开关 或 输入 。 图 8. 12 展示 
了 具有 多 重 输入 开关 的 系统 。 

用 于 处 理 多 重 输入 的 消 拌 算法 〈 伪 代码 ) 显示 如 下 : 


// This program demonstrates the Simultaneous debouncing 
// of mltiple inputs. The :input subroutine is easily 
// adjusted to handle any number of inputs 


Main: 


GOSUB Debounce_Switches // get debounced inputs 
PAUSE 50 // time between readings 
GOTO Main // Continue the loop 
END 


Debounce_Switches: 
switches = OxF // enable all four inputs 


FOR X=1 TO 0 
Switches = Switches & ~Switch_Inputs // test inputs 
PAUSE 5 // delay between tests 


NEXT 
RETURN 


Debounce- Switches 子 程 序 的 目的 是 确保 输入 保持 稳定 50 毫秒 而 没有 触 
点 抖动 。 消 拌 输 入 将 以 变量 形式 返回 开关 ， 在 开关 位 置 以 一 个 逻辑 “1? 
代表 一 个 有 效 输入 。 

Debounce-Switches 程序 开始 时 假设 所 有 开关 输入 都 是 有 效 的 ， 所 有 开 
关 的 位 设 为 1。 然 后 ， 扫 描 输 入 并 与 FOR- NEXT 循环 中 先前 的 状态 比较 。 
由 于 输入 为 低 电 平 有 效 ( 按 下 时 为 0),， “1” 的 求 补 运算 符 将 其 反 转 。 庚 
辑 与 (&&) 运算 符 用 于 校正 当前 的 状态 。 一 个 开关 要 有 效 ， 它 必须 在 整个 
FOR-NEXT 循环 中 保持 按 下 状态 。 

以 下 是 消 抖 技术 的 工作 原理 : 当 开 关 按 下 时 ， 开 关 的 输入 将 为 0， 如 
图 8. 12 所 示 。“1” 的 求 补 运算 符 将 “0” 反 转 为 “1”。1“ 与 ”1 还 是 1， 
所 以 开关 保持 有 效 。 如 果 开 关 没 有 按 下 ， 开 关 的 输入 则 为 “1” (由 于 
10kQ 拉 至 fi) 。1 反 转 为 0，0“ 与 ”任何 数 数字 还 是 0， 导 致 在 整个 循环 
过 程 中 开关 保持 无 效 状态 。 
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图 8. 12 具有 多 个 开关 的 电路 


我 们 总 是 推荐 通过 时 钟 中 断 触发 Debounces- Switches 程序 ， 而 不 是 推 
荐 消 拌 输入 间 50 毫秒 的 固定 延 时 ， 这 样 做 是 为 了 使 设计 具有 可 移植 性 。 


8.5 现 有 的 解决 方案 


对 于 不 含 外 部 输入 的 消 拌 电路 设计 而 言 ， 系 统 可 选择 使 用 外 部 消 拌 集 
成 电路 。 在 最 常用 集成 电路 中 ，MAXIM MAX6816/MAX6817/MAX6818 系 
列 提供 了 单个 、 两 个 、 八 个 开关 消 拌 电 路 ， 它 们 为 数字 系统 提供 了 机 械 开 
关 的 完全 接口 技术 。 如 图 8. 13 展示 了 MAX6816 与 任何 需要 消 拌 输入 引 脚 
但 不 包含 内 部 消 拌 电路 的 微 处 理 器 或 芯片 的 互联 。 





图 8. 13 MAX6816 的 消 抖 复位 输入 
图 片 来 源 : Copyright (©) Maxim Integrated Products (http:/maxim-ic. com ) ， 
经 授权 使 用 
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MAX681x 系列 产品 接受 一 个 或 多 个 来 自 机 械 开关 的 抖动 输入 ， 并 在 短 
暂 的 预 置 限制 延 时 后 产生 一 个 完全 的 数字 输出 。 

MAX6818 八 通道 开关 消 拌 电路 用 于 数据 总 线 接口 。MAX6818 监控 开 
关 并 提供 开关 状态 变化 输出 (CH) ， 简 化 了 微 处 理 器 (phP) 的 定时 询问 
和 中 断 。 

事实 上 ， 所 有 机 械 开 关 在 断 开 和 闭合 时 都 会 抖动 。 当 开关 上 断 开 或 
闭合 时 ， 消 拌 电路 通过 要 求 连续 的 时 钟 输入 在 若干 采样 周期 内 保持 相 
同 状 态 而 达到 消 拌 的 目的 。 输 入 保持 40 毫秒 的 稳定 状态 输出 才 发 生 
变化 。 

图 8. 14 展示 了 包含 局 片 振荡 器 、 计 数 器 、“ 异 或 非 ” 门 、D 触发 
器 的 功能 块 。 当 输入 不 等 于 输出 时 ，“ 异 或 非 ” 门 使 重 置 计数 器 。 当 
开关 输入 在 整个 限定 周期 内 状态 稳定 ,计数 器 为 触发 器 计时 ， 更 新 


输出 。 











IN VOLTAGE MAX6816 
| LOCKOUT MAX6817 
PROTECTION MAXO818 


图 8.14 MAX6816/6817/6818 结构 图 
图 片 来 源 : Copyright (©@) Maxim Integrated Products (http :maxim- ic. com) ， 经 授权 
使 用 


欠 电 压 锁定 电路 确保 在 加 压 下 输出 处 于 正确 的 状态 。 当 电源 电压 低 于 
低 电压 阔 值 时 ， 消 抖 电路 保持 通 透 。 开 关 状 态 处 于 没有 延 时 的 逻辑 输出 。 

除了 消 拌 电 路 外 ， 上 述 Maxim 设备 还 包括 在 所 有 引 脚 上 的 + 15kV 更 
电 放 电 保护 ， 以 防止 在 处 理 和 装配 时 遇 到 静电 放电 。 
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电子 线路 易于 接收 来 自 其 他 发 射 器 的 辐射 信号 ， 无 论 是 有 意 或 无 意 发 
射 。 这 些 电磁 干扰 (EMI) 使 得 设备 内 毗邻 的 元 件 不 能 同时 工作 。 这 就 有 
必要 进行 电磁 兼容 (Electro Magnetic Compliance，EMC) 设计 以 避免 系统 
内 有 害 的 电磁 干扰 。 

以 前 ， 由 于 较 差 的 EMC， 发 射 器 干扰 电视 图 像 正 常 显示 是 常见 现象 。 
现在 随 着 电子 装备 现代 化 ， 我 们 可 以 几乎 毫 无 干扰 地 在 任何 电子 设备 附近 
使 用 移动 电话 和 其 他 无 线 设 备 。 这 都 是 由 于 确保 了 设备 不 产生 多 余 的 辐 
射 ， 同时 设备 也 不 易 受 到 射频 辐射 的 干扰 。 采 用 好 的 EMC 设计 原则 使 这 
些 成 为 可 能 。 


加 注意 
与 大 多 数 项 目 不 同 ，EMC 承诺 不 能 只 由 设计 来 保证 ， 必 须 经 过 测试 。 


电磁 兼容 性 是 一 个 系统 在 预期 的 电磁 环境 中 运行 而 不 对 其 他 系统 产生 
不 利 影响 或 不 受 其 他 系统 不 利 影响 的 能 力 … 。 
一 个 系统 电磁 兼容 应 满足 : 
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。 不 干扰 其 他 系统 ; 

。 不 易 受 其 他 系统 的 干扰 ; 

。 自身 不 干扰 。 

换言之 ， 电 磁 耦 合 性 包括 辐射 、 免 疫 和 自 兼 容 。 电 磁 兼 容 性 的 每 一 项 
包括 三 个 因素 : 


a) 源头 ， 谁 是 噪声 的 发 射 体 

b) 受 体 ， 谁 是 噪声 的 接收 者 

c) 耦合 机 理 ， 通 过 这 种 机 理 噪 声 从 源头 传输 到 受 体 ， 并 产生 数 种 不 
同 现象 。 

图 9. 1 显示 了 4 种 基本 的 耦合 机 理 : 传导 耦合 、 电 容 耦 合 、 磁 耦合 或 
感应 耦合 ， 辐 射 耦合 。 每 一 种 耦合 途径 可 分 解 为 一 种 或 多 种 耦合 机 理 的 共 
同 作 用 。 





图 9.1 4 种 耦合 机 理 (图 片 源 于 : Wikipedia. org) 


图 9. 1 还 显示 ， 噪 声 源 驱动 电流 ， 这 种 电流 通过 和 烛 合 途径 (例如 ， 
PCB 连接 ) 流动 并 产生 电压 降 。 这 种 电压 扰动 通过 耦合 途径 传输 给 受 体 ， 
如 果 这 个 电 平 足够 高 则 导致 其 功能 失常 。 因 此 ， 采 用 好 的 设计 原则 避免 这 
种 情况 非常 重要 。 

下 面 介 绍 本 章 将 要 使 用 的 一 些 术 语 。 

一 个 很 相关 的 术语 是 电磁 干扰 (EMI) ， 这 是 一 个 电子 设备 中 破坏 性 
的 电磁 能 量 通 过 辐射 或 (和) 传导 途径 传输 到 另 一 个 电子 设备 的 过 程 。 

一 个 设备 的 电磁 敏感 度 (Electro Magnetic Susceptibility，EMS) 水 平 是 
指 对 电气 干扰 和 传导 式 电气 噪声 的 抵抗 能 力 。 静 电 放电 (Electrostatic Dis- 
charge，ESD) 和 快速 瞬间 触发 (Fast Transient Burst，FTB) 试验 确定 一 个 
设备 在 不 良 电 磁 环 境 中 运行 时 的 可 靠 性 水 平 。 
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第 三 部 分 是 图 9. 2 显示 的 从 源头 到 受 体 的 非 预期 途径 。 

这 样 ， 如 果 电 动 剃 须 刀 厂 商 遵 循 了 必要 的 电磁 兼容 性 设计 原则 ， 则 在 
听 调 幅 广播 时 使 用 电动 剃 须 刀 也 没有 什么 问题 了 。 在 此 例 中 ， 电动 剃 须 刀 
电动 机 电 刷 的 电弧 放电 就 是 一 种 意外 辐射 ; 调幅 广播 通过 相关 途径 (电线 
和 /或 通过 空气 ) 接收 到 噪声 就 是 不 必要 的 敏感 度 。 





图 9.2 描述 EMC 范例 的 框图 


9. 3 ”电磁 干扰 理论 及 与 电流 和 频率 之 关系 


电流 是 产生 电磁 辐射 的 关键 。 当 微 控制 器 速度 增加 ， 电 流 的 需求 也 增 
加 。 电 流 流 过 一 个 回路 则 产生 磁场 ， 磁 场 大 小 与 回路 面积 成 正比 。 回 路 面 
积 定义 为 线路 长 度 乘 以 到 接地 板 〈the ground plane) 的 距离 。 当 信号 改变 
逻辑 状态 时 ， 变 化 的 电压 产生 电场 。 这 样 ， 电 流 回 路 生成 了 辐射 。 下 面 的 
方程 式 显 示 了 电流 、 回 路 面积 与 电磁 干扰 频率 的 关系 。 

EMI(V/m) =k1Af’ 

式 中 : k= 比例 常数 

1= 电 流 (A) 
4A = 回路 面积 (m) 
f= 频率 ( MHz) 

由 于 线路 板 层 倒 要 求 ， 到 接地 板 的 距离 通常 固定 ， 因 此 ,减少 辐射 的 

关键 就 是 减少 电路 板 设计 的 线路 长 度 。 
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9.4 电磁 干扰 的 规程 、 标 准 和 认证 


目前 存在 几 种 有 关 EMS 和 EMI 问题 的 标准 ， 每 种 标准 都 有 其 应 用 领域 ， 用 于 制 成 产品 或 

设备 。 到 目前 为 止 ， 还 没有 应 用 于 子 体系 或 电子 元 器 件 的 官方 标准 。 然 
而 ，EMC 测试 必须 在 子 系统 中 执行 ， 以 用 于 评估 和 优化 电磁 兼容 性 性 能 的 
应 用 。 

表 9.1 和 表 9.2 显示 了 常见 的 EMC/EMI 标准 。 

额定 功率 小 于 600 瓦 的 个 人 计算 机 、 显 示 器 和 电视 机 等 ， 必 须 符 合 EN 
61000-3-2 DD 类 谐 波 限制 。 照 明 设备 必须 符合 C 类 谐 波 限制 。 便 携 的 工具 
和 非 专业 的 弧 光 电焊 设备 必须 符合 B 类 谐 波 限 制 。 所 有 产品 必须 符合 A 类 
( 见 表 9.1) 谐 波 限制 。 





表 9.1 电磁 发 射 

标 准 相等 的 国际 标准 描 述 
EN 50081 一 1 通用 发 射 标准 一 一 住宅 
EN 50081 一 2 通用 发 射 标准 一 一 工业 
EN 55011 CISPRO 11 用 于 工业 、 科 学 和 医学 (ISM) 的 无 线 电 频率 设备 
EN 55013 CISPR 13 用 于 广播 收音 机 及 相关 设备 
EN 55014 CISPR 14 用 于 家 用 电器 、 电 动工 具 
EN 55022 CISPR 22 用 于 信息 技术 设备 ， 如 计算 机 等 


FCC®, Part 15 无 线 电 频率 设备 一 一 无 意 的 辐射 体 
FCC, Part 18 工业 、 科 学 和 医学 设备 


CDCISPR: 国际 无 线 电 干扰 特别 委员 会 
@FCC: 美国 联邦 通信 委员 会 








表 9.2 电磁 敏感 性 
标 准 相等 的 国际 标准 描 述 
EN50082 一 1 一 般 抗 扰 标 准 一 一 住宅 
EN50082 一 2 一 般 抗 扰 标 准 一 一 工业 
EN50140 IEC 61000-4-3 辐射 、 射 频 、 电 磁场 抗 干扰 性 试验 
EN50141 IEC 61000-4-6 对 射频 场 感应 引发 的 传导 干扰 的 抗 干扰 性 试验 
EN50142 IEC6 1000-4-5 浪 涌 抗 干扰 性 试验 


IEC 61000-4-4 EFT/ 触 发 抗 干扰 试验 
IEC 61000-3-2 谐 波 电流 辐射 的 限制 
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9.5 影响 集成 电路 抗 干扰 性 能 的 几 个 因素 


当今 低 成 本 微 控制 器 的 半导体 工艺 技术 可 以 实现 晶体 管 顶 极 长 度 在 
0. 65 ~ 0. 090 微米 之 间 ， 这 些 栅 极 长 度 能 产生 和 响应 生成 时 间 为 亚 纳 秒 级 
的 信号 。 因 此 ， 微 控制 器 能 响应 注入 其 引 脚 的 静电 放电 信号 或 EFT 信号。 
除 制造 工艺 外 时 ， 微 控制 器 对 于 ESD 或 EFT 事件 的 性 能 还 取决 于 集成 电路 
设计 和 封装 、 印 制 电路 板 (PCB) 的 设计 、 微 控制 器 上 运行 的 软件 、 系 统 
设计 和 到 达 微 控制 器 时 ESD 或 EFT 波形 的 特征 。 

在 过 去 ， 当 对 EMC 一 无 所 知 时 ， 通 常 的 做 法 就 是 ， 对 一 个 未 考虑 过 
任何 EMC 的 现 有 产品 ， 加 装 必 要 的 滤波 器 、 电 涌 保 护 器 ， 采 取 屏 蔽 等 各 
种 手段 使 它 满足 EMC。 这 是 最 不 合理 的 方法 ， 因 为 这 样 做 的 成 本 过 高 而 结 
果 不 如 预期 。 

当 设计 新 产品 时 ， 必 须 从 开始 阶段 就 着 手 考虑 遵循 EMC 指南 ， 这 对 
低 成 本 的 解决 方案 尤为 重要 。 好 的 PCB 设计 在 生产 中 并 不 比 差 的 成 本 高 ， 
但 修理 差 的 PCB 费用 就 高 了 。 一 个 设计 者 所 犯 的 最 昂贵 的 错误 就 是 认为 
EMC 放 在 最 后 处 理 。 

对 于 小 批量 快速 上 市 的 系统 ， 如 果 不 是 大 批量 低 成 本 应 用 ， 使 用 贵 的 
元 件 仍 是 合理 的 ， 更 好 的 方法 是 在 设计 上 投入 更 多 时 间 和 资源 以 减少 最 终 
产品 的 总 成 本 。 

下 面 推荐 了 更 好 的 EMC 设计 指南 。 在 此 之 前 ， 我 们 先 看 看 一 些 影响 
EMC 的 因素 。 


9. 5. 1 ”作为 噪声 源 的 微 控 制 器 


在 微 控制 器 的 应 用 环境 中 ,静电 放电 、 电 源 、 高 电流 或 电压 下 的 开 
关 、 射 频 (RF) 发 生 器 等 就 是 产生 电磁 干扰 或 噪声 的 一 些 因素 。 

微 控制 器 (或 其 分 支 电 路 ) 既是 源头 也 是 受 体 。 

日 电源 和 地 线 中 的 电流 : 作为 CMOS 设计 的 一 部 分 ， 时 变 电 流 在 电 
源 和 地 线 中 流动 ， 以 数 种 不 同方 式 产生 辐射 和 传导 EMI。 

。 振荡 器 行为 : 当 振 荡 器 为 微 控制 器 提供 时 钟 脉冲 源 时 ， 它 就 是 一 
个 连续 的 RF 源 。 在 振荡 器 电路 各 部 分 流动 的 任何 时 变 电 流 都 是 重 
要 的 发 射 源 ， 包 括 流 经 输入 、 输 出 、 电 源 和 接地 部 分 的 电流 。 
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。 系统 时 钟 电路 : 系统 时 钟 可 能 是 系统 中 最 大 的 噪声 源 ， 尤 其 随 着 
当今 PC 和 工作 站 需要 更 高 的 时 钟 频 率 。 这 种 辐射 主要 由 基本 谐 波 
和 低 阶 高 次 谐 波 产 生 ， 遗 憾 的 是 ， 常 与 收音 机 的 常用 高 频 FM 波段 
冲突 并 干扰 。 这 就 迫使 监管 机 构 对 可 能 使 用 时 钟 并 产生 辐射 的 PC 
和 电子 设备 施加 电磁 辐射 限制 。 

。 输出 行为 : 任何 常见 单片机 的 输出 行为 包括 时 钟 输出 、 数 据 和 地 
址 信号 ， 都 是 潜在 的 发 射 源 。 在 内 部 开关 中 的 电流 也 同样 涉及 开 
关 工 作 载 荷 ， 但 负载 电流 流 过 的 途径 更 长 。EMI 源 于 时 变 负载 电 
流 ， 这 些 电流 不 仅 在 信号 线路 中 流动 ， 还 流 到 地 线 或 电源 线 中 。 
输出 信号 相对 权重 取决 于 变换 的 频率 和 持续 时 间 ， 即 ， 转 换 时 间 
越 短 ， 频 谱 越 丰富 。 除 此 之 外 ， 和 输出 线路 的 信号 会 产生 串扰 、 开 
关 噪 声 和 反射 。 

。 开关 骂 声 : 开关 噪声 是 指 当 一 个 信和 号 激发 起 通路 电感 和 负载 电容 
的 谐振 而 产生 的 干扰 信号 。 开 关 噪 声 大 到 引起 误 操 作 才 会 引起 关 
注 ， 而 它 同样 会 增加 额外 的 谐 波 量 从 而 增加 EMI。 

。 LO 开关: IO 开关 的 负载 包括 封装 引 脚 和 焊 线 电感 。 最 坏 情 况 下 
的 噪声 依赖 于 开关 时 间 。 

对 于 一 些微 控制 器 ， 存储 空间 (地址 /数据 总 线 ) 通常 是 外 部 的 (如 
SRAM、DDR 等 ) ， 这 意味 着 信和 号 在 数 个 线路 上 的 连续 转换 ， 这 将 
对 总 体 的 电磁 兼容 产生 重大 影响 。 


9.5.2 影响 电磁 兼容 性 的 其 他 因素 


除 微 控制 器 外 ， 其 他 影响 电磁 兼容 性 的 因素 包括 以 下 几 个 。 

。 电压 : 较 高 的 电源 电压 意味 着 更 大 的 电压 摆动 和 更 多 的 辐射 。 较 
低 的 电源 电压 影响 敏感 性 。 

。 频率 : 频率 越 高 发 射 越 多 。 当 晶体 管 因 开关 通 断 时 ， 高 频数 字 系 
统 则 产生 电流 尖 脉 冲 ， 增 加 了 总 体 的 噪声 。 

。 接地 : 无 论 是 发 射 、 敏 感性 或 自 兼容 性 等 所 有 电磁 兼容 性 问题 ， 
最 重要 的 问题 是 接地 不 充分 影响 EMC。 单 点 接地 在 低频 率 下 是 可 
以 的 ， 但 高 频率 下 有 高 阻抗 性 就 不 行 了 。 多 点 接地 最 适用 于 高 频 
率 应 用 ， 如 数字 电路 等 〈 见 图 9.3) 。 
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图 9.3 接地 方案 


日 集成 电路 设计 / 印 制 电 路 板 : 芯片 尺寸 、 制 造 工 艺 、 版 面 布 局 (多 
点 接地 和 电源 引 脚 改进 ) 和 封装 方法 都 会 影响 EMI。 而 且 ， 人 恰当 
的 印 制 电路 板 布局 对 防范 电磁 干扰 也 必 不 可 少 。 


国 ) 注意 
9. 5.2 节 解 释 过 的 一 些 因素 (如 电压 和 频率 ) 也 适用 于 微 控 制 器 。 


9. 5.3 噪声 载体 


EMI 可 通过 电磁 波 、 传 导 、 容 性 /感性 耦合 来 传递 。EMI 必须 到 达 导 体 才 
能 干扰 元 器 件 。 这 就 意味 着 导体 的 回路 、 超 长 或 大 面积 容易 受到 EMI 影响 。 


9.6 减少 EMC/EMI 的 技术 


防止 干扰 的 三 种 办 法 是 : 
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1) 在 源头 抑制 发 射 。 

2) 耦合 路 径 尽 可 能 低 效 。 

3) 受 体 几乎 不 受 发 射影 响 。 

本 节 提 出 了 处 于 不 同 抽象 层次 的 常用 噪声 降低 技术 。 提 出 的 技术 不 是 
EMI 的 完整 解决 方案 ， 但 是 采用 这 些 技术 可 以 极 大 影响 存在 噪声 的 系统 的 
性 能 。 


9. 6.1 系统 级 技术 


9. 6. 1.1 展 频 时 钟 技术 


在 数字 系统 内 ， 周 期 性 的 时 钟 信号 是 EMI 辐射 的 主要 原因 。 此 外 ， 
控制 与 计时 信号 、 地 址 和 数据 总 线 、 互 连 电 缆 和 连接 器 都 会 产生 EMI 
发 射 。 

屏蔽 是 通过 覆盖 发 射 位 置 来 减少 EMI 发 射 的 一 种 简单 方式 ， 但 额外 增 
加 了 重量 、 空 间 和 费用 。 通 常 屏 蔽 使 得 自动 化 生产 变 得 困难 ， 因 而 大 量 增 
加 了 人 力 劳动 。 

用 低 通 滤波 器 减少 EMI 也 有 自身 层面 的 问题 ， 如 对 高 速 系统 无 效 ， 因 
为 这 种 滤波 器 既 减 少 了 关键 的 建立 时 间 和 保持 时 间 的 裕 量 ， 同 时 增加 信和 号 
过 冲 、 下 冲 和 振荡 。 除 此 之 外 ， 滤 波 器 的 另 一 个 主要 问题 是 技术 不 是 系统 
性 的 ， 即 在 任何 一 个 指定 节点 降低 EMI 发 射 并 不 能 减少 在 其 他 节点 的 
发 射 。 

一 个 更 为 有 效 的 方法 是 使 用 展 频 时 钟 技术 (Spread Spectrum Clocking， 
SSC) 来 控制 和 减少 电磁 干扰 辐射 。 展 频 时 钟 发 生 器 通过 将 辐射 传播 到 更 
宽频 带 的 方式 来 减少 辐射 发 射 (如 图 9.4 所 示 ) 。 通 过 在 几 百 千 赫 效 频率 





图 9.4 典型 的 调制 曲线 
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范围 内 调制 处 理 器 时 钟 ， 这 个 频带 可 以 随 着 测量 的 辐射 量 减少 而 增 宽 。 这 
样 ，SSC 会 按 预 定 的 途径 〈 即 ， 调 制 曲线 ) 用 预定 的 调制 频率 调制 时 钟 频 
率 / 周 期 ， 而 不 是 维持 恒定 的 系统 时 钟 频率 。 

调制 频率 通常 选择 为 大 于 30kHz (高 于 声 频 带 ) ， 常 用 的 是 用 30 ~ 
90kHz， 这 样 从 源头 上 来 控制 和 减少 EMI 发 射 。 调 制 频率 的 上 限 值 选 得 足 
够 小 ， 以 避免 系统 的 定时 间 题 和 跟踪 问题 。 

比较 其 他 减少 EMI 的 技术 ，SSC 系统 性 的 性 质 有 一 个 很 大 的 优势 ， 因 
为 所 有 时 种 和 来 自 SSC 时 钟 的 时 序 信号 都 是 以 相同 百分比 来 调制 的 ， 导 致 
整个 系统 内 EMI 极 大 地 减少 了 。 

SSC 产生 带 有 边 带 谐 波 的 频谱 。 有 意 地 扩 宽 系统 重复 时 钟 窗 的 频带 ， 
同时 减少 系统 时 钟 基 频 和 谐 波 的 谱 密度 峰值 。 

除了 减少 EMI 外 ，SSC 还 有 利于 电路 板 线路 与 时 钟 驱 动 器 驱动 负载 之 
间 的 阻抗 匹配 ， 这 是 时 钟 信号 完整 性 的 一 个 重要 考虑 。 


9. 6. 1.2 差分 时 钟 


差分 时 钟 要 求 时 钟 发 生 器 同时 提供 时 钟 和 反 向 时 钟 ， 反 向 时 钟 有 与 主 
时 钟 大 小 相等 方向 相反 的 电流 ， 相 位 差 为 180"。 必 须 注意 电路 板 设计 者 需 
要 确保 主 时 钟 线 和 反 向 时 钟 线 按 已 选择 路 线 并 排 在 一 起 ， 这 一 点 非常 重 
要 。 时 钟 信号 在 负载 端 通过 差分 放大 器 接收 ， 这 意味 着 合格 的 时 钟 波形 是 
两 条 时 钟 线 上 信号 的 差异 。 

差分 时 钟 引起 EMI 减少 是 由 于 磁场 对 消 的 原因 ( 见 图 9.5) 。 由 于 磁 
场 按 右 手法 则 随 电流 流动 ， 而 相位 差 为 180° 的 两 股 反 相 电 流 所 产生 的 磁场 
相互 抵消 。 减少 磁场 导致 辐射 降低 。 

时 钟 导致 的 H 磁 场 时 钟 导致 的 H 磁 场 


wil 


图 9.5 差分 时 钟 中 的 磁场 对 消 
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与 单 端 时 钟 不 同 ， 单 端 时 钟 产 生 的 噪声 出 现在 基准 面 ， 并 可 能 耦合 到 
输入 /输出 线 中 。 与 此 不 同 ， 差 分 时 钟 回路 是 反 向 时 钟 信 号 ， 比 基准 面 提 
供 了 更 好 的 隔离 ， 减 少 输 入 /输出 线 耦合 ， 从 而 减少 EMI。 

通常 两 条 线 〈 时 钟 线 和 反 向 时 钟 线 ) 应 尽量 靠近 。 将 地 线 放 在 差分 时 
钟 线 外 侧 可 以 进一步 减少 辐射 。 


9. 6.2 板 级 技术 


本 节 仅 包含 芯片 设计 者 必须 知道 的 基本 板 级 技术 ， 以 便 让 设计 者 对 在 
芯片 上 执行 的 逻辑 与 在 电路 板 上 执行 的 逻辑 间 进 行 权 衡 。 超 出 本 节 的 详细 
内 容 则 不 在 本 书 的 范围 之 内 。 


9. 6.2.1 电源 输入 滤波 


消除 动态 干扰 问题 的 首要 机 会 在 应 用 电路 的 电源 或 信号 输入 点 。 如 果 
能 够 在 此 处 充分 抑制 干扰 信号 ， 就 可 能 不 需要 其 余 的 软 硬 件 技术 了 。 除 了 
能 降低 材料 成 本 ， 还 能 降低 或 者 消除 不 合 规 引起 的 风险 。 

图 9.6 显示 ,在 输入 点 没有 加 装 滤波 器 的 情况 ， 传 播 到 电路 板 1 的 传 
导 王 扰 信和 号 能 够 辆 射 或 耦合 到 电路 板 2。 











图 9.6 输入 点 没有 加 装 滤波 器 


图 9.7 所 示 ， 在 输入 点 加 装 滤波 器 ， 有 助 于 抑制 传导 的 干扰 信号 ， 从 
而 向 电路 板 1 提供 干净 的 信号 而 不 会 产生 内 部 辐射 。 

在 电源 和 信号 连接 到 应 用 电路 之 前 ， 在 输入 点 瞬 态 抑制 应 进行 优化 ， 
否则 由 于 干扰 信号 失控 ,兼容 性 问题 将 复杂 化 。 结 果 导 致 需 要 后 续 的 软 硬 
件 技术 以 确保 好 的 EMC 性 能 。 
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图 9.7 输入 点 加 装 滤波 器 


适 入 输入 点 应 用 电路 的 瞬 态 抑制 器 件 随时 可 从 众多 供应 商 购买 ， 如 有 
需要 ， 还 可 以 设计 定制 方案 。 


9. 6. 2.2 更 多 的 滤波 器 


当 信号 噪声 源 不 能 消除 时 ， 推 荐 把 滤波 器 作为 最 后 的 手段 。EMI 滤波 
器 和 铁 氧化 物 磁 珠 是 常用 的 滤波 器 。 铁 氧化 物 磁 珠 可 以 增强 电感 以 抑制 
高 频 。 

电磁 干扰 (EMI) 滤波 器 

在 商业 中 EMI 滤波 器 用 于 消除 电源 线 中 的 高 频 噪 声 。EMI 滤波 器 通常 
由 电容 器 与 电感 器 组 成 。 需 要 EMI 滤 没 器 的 节点 阻抗 决定 了 电容 器 和 电感 
器 的 配置 。 高 阻抗 节点 需要 电容 器 ， 低 阻抗 节点 需要 电感 器 。 

EMI 滤波 器 也 可 以 由 穿 心 电容 器 、 工 型 电路 、PI 型 电路 和 T 型 电路 等 
组 成 。 穿 心 电 容器 的 主要 部 件 就 是 一 个 电容 器 。 当 连接 到 滤波 器 的 阻抗 是 
高 阻 时 穿 心 电容 器 是 不 错 的 选择 。 图 9. 8 描述 了 穿 心 电容 器 。 穿 心 电 容 器 
并 不 提供 节点 间 高 频 电流 隔离 。 


烛 


图 9.8 穿 心 电容 器 





图 9. 9 所 示 为 工 型 电路 ， 在 电容 器 旁 有 一 个 电感 器 。 这 种 配置 最 适用 
于 输入 和 输出 阻抗 差别 很 大 的 情况 。 感 性 元 件 连接 至 最 低 阻 抗 端 。 
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4 
坟 


图 9.9 工 型 电路 


图 9. 10 所 示 为 FI 型 电路 ， 两 个 电容 器 围 着 一 个 电感 器 。 当 输入 和 输 
出 阻抗 差别 很 大 时 ，PI 型 电路 最 适用 。 当 需要 高 阶 衰减 时 也 可 用 FI 型 
电路 。 


二 
二 


图 9.10 PI 型 电路 


图 9. 11 所 示 为 了 型 电路 , 一 个 电容 器 两 侧 均 有 一 个 电感 器 。 当 输入 
和 输出 阻抗 都 是 低 阻 时 最 适用 。 


oo ' Th 


图 9.11 TT 型 电路 


其 他 可 选 方案 是 在 电源 输入 点 使 用 铁 氧 体 磁 环 ， 这 对 于 衰减 1MHz 以 
上 频率 又 不 导致 低频 功率 损耗 是 经 济 便捷 的 方法 。 它 们 体积 小 ,一般 可 以 
套 在 元 件 引 线 或 导线 上 。 


9. 6. 2. 3 元件 布 局 


子 系统 、 部 件 和 连 线 的 布局 很 重要 。 有 了 噪声 的 子 系统 、 部 件 、 连 线 应 
当 与 敏感 的 电子 器 件 〈 如 微 控 制 器 ) 物理 隔离 ， 以 使 辐射 噪声 耦合 最 小 
化 。 物 理 隔 离 可 采用 距离 分 离 或 屏蔽 的 形式 。 建 议 遵循 以 下 指导 原则 。 
。 将 供电 电路 与 模拟 和 数字 逻辑 电路 分 开 。 最 简单 的 办 法 是 采用 独 
立 的 PCB 来 放置 供电 电路 。 
。 将 与 同一 时 钟 线 相 关 的 所 有 部 件 尽 量 靠近 放置 。 这 可 减少 走 线 长 
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度 ， 进 而 减少 辐射 。 
。 将 大 电流 器 件 尽 可 能 靠近 电源 。 
。 电路 板 高 频 部 分 尽量 不 使 用 插座 。 插 座 会 引起 高 电感 和 阻抗 失 配 。 
。 将 晶振 、 振 功 器 和 时 钟 发 生 器 远离 输入 /输出 端 和 电路 板 边缘 。 这 
些 器 件 产生 的 EMI 会 耦合 到 输入 /输出 端口 。 
。 将 晶振 平 放 在 PCB 上 ， 从 而 减少 到 地 的 距离 ， 并 在 电路 板 上 产生 
更 好 的 电磁 场 耦 合 。 
将 晶振 的 固定 带 接 地 。 如 果 不 接地 ， 这 些 固定 带 会 像 天 线 一 样 产 
生 辐射 。 


9. 6. 2.4 接地 路 径 


许多 EMC 设计 技术 的 基本 思想 是 控制 所 有 信和 号 的 接地 路 径 ， 确 保 该 
路 径 远 离 可 能 受 干扰 的 信号 和 电路 。 对 于 发 送 的 噪声 ， 这 意味 着 在 它 离 开 
系统 前 确保 噪声 找到 接地 路 径 。 对 于 接收 的 噪声 ， 这 意味 着 在 它 到 达 系 统 
敏感 部 分 前 确保 找到 接地 路 径 。 

除了 9. 5. 2 节 提 及 的 有 关 接 地 需要 考虑 的 事项 外 ， 接 地 布局 是 至 关 重 
要 的 。 下 面 给 出 一 些 好 的 接地 布局 建议 。 

。 不 要 将 接地 层 和 电源 层 分 开 。 

。 为 减少 接地 噪声 耦合 ， 将 数字 地 与 模拟 信号 地 分 开 以 减少 耦合 。 

。 不 要 改变 有 信号 走 线 的 层 ， 这 可 能 导致 增加 回路 面积 而 增加 辐射 。 

。 连接 所 有 接地 通 孔 到 每 个 接地 层 ， 同 样 地 在 等 电位 下 连接 每 个 电 

源 通 孔 到 所 有 电源 层 。 
。 使 接地 层 至 少 比 电源 层 长 5 倍 于 两 层 的 距 " ， 这 使 得 交流 电 的 电 
位 差 能 被 接地 层 吸 收 。 


9. 6. 2.5 线路 布线 


传输 高 速 信号 的 线路 必须 十 分 小 心地 布线 。 平 行走 线 哪 怕 距 离 很 短 也 
会 产生 容 性 和 感应 串扰 。 

在 电容 耦合 中 ， 源 的 上 升 沿 会 引起 受 体 的 上 升 沿 。 试 验 电 路 板 特别 容 
易 出 现 这些 问 题 ， 因 为 每 排 中 过 长 的 金属 片 在 线路 之 间 产 生 几 皮 法 的 
电容 。 

在 电感 耦合 中 ， 受 体 中 电压 的 变化 与 源 的 沿 变化 方向 相反 。 电 感 耦 合 
是 电磁 干扰 的 一 种 形式 ， 电 线 或 线路 中 电流 的 变化 通过 电磁 感应 导致 另 一 
个 电线 线路 产生 电压 。 
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大 多 数 串 扰 例 子 都 是 容 性 串扰 。 受 体 中 噪声 的 大 小 与 平行 走 线 的 距 


离 、 频 率 、 发 射 源 中 电压 波动 幅度 、 受 体 的 阻抗 等 成 正比 ,与 间距 成 
反比 。 


电感 耦合 常见 于 低频 率 能 量 源 ， 而 高 频率 能 量 源 常 用 电容 耦合 。 
根据 美国 联邦 通信 委员 会 的 限制 ， 当 线路 长 度 超过 波长 的 1/10 时 通 


常 就 变 得 重要 了 。 军 用 标准 的 规定 是 波长 的 1/20 至 1/30。 对 于 汽车 和 消 
费 电子 的 两 层 板 ， 达 到 波长 的 1/50 就 开始 变 得 严重 了 ， 特 别 是 在 没有 屏 
蔽 的 应 用 时 。 在 超过 以 上 这 些 范围 时 ， 线 路 就 像 天 线 一 样 ， 会 增加 辐射 。 
线路 超过 4 英寸 就 会 产生 FM 波段 噪声 。 在 这 种 情况 下 ， 建 议 采 用 一 些 形 
式 的 终端 负载 来 防止 振荡 。 


9. 6. 2.6 制作 分 区 


以 下 的 一 些 布线 指南 会 有 助 于 防止 辐射 或 串扰 。 


与 微 控制 器 连接 的 传输 射频 的 线路 应 当 远 离 其 他 信号 以 免 接 收 到 
噪声 。 

为 增加 线路 间 的 隔离 读 ， 相 邻 线路 间 的 距离 应 当 增 大 ， 或 者 在 关 
键 线路 的 两 侧 增加 保护 线路 。 在 相 邻 的 布线 层 中 间 增 加 屏蔽 层 也 
是 个 好 办 法 。 

不 要 在 晶体 、 振 荡 器 和 时 钟 发 生 器 下 布线 ， 因 为 这 些 电 路 容易 接 
收 到 噪声 。 

为 了 控制 电路 板 边 缘 的 线路 周围 的 电磁 场 ， 应 使 线路 离 板 沿 距离 
大 于 线路 距 接 地 层 的 高 度 " 。 这 样 可 使 得 线路 周围 的 电磁 场 更 易 
于 和 接地 层 耦 合 ， 而 不 会 和 附近 电线 或 其 他 电路 板 耦 合 。 

当 线 路 从 一 层 转 换 至 另 一 层 时 ， 如 果 两 层 电路 板 与 电源 层 /接地 层 
不 等 距 ， 则 必须 改变 线路 宽度 和 间隔 以 保持 线路 阻抗 。 如 果 在 回 
路 区 域 进 行 各 种 可 能 处 理 的 结果 都 会 增加 辐射 ， 则 应 尽量 避免 
换 层 。 

可 能 受到 噪声 干扰 的 信号 在 其 下 面 应 当 有 返回 地 ， 用 于 减 小 其 阻 
抗 ， 因 而 减 小 噪声 电压 和 辐射 区 域 。 

如 果 有 可 能 ， 则 把 若干 会 产生 噪声 的 线路 布 在 一 起 ， 周 围 布 一 些 
接地 线 。 


处 理 EMC 问题 一 个 较 好 办 法 是 将 PCB/ 电 路 板 分 隔 成 更 小 的 区 域 ， 在 


每 个 区 域 中 处 理 问题 。 这 包括 在 电路 板 上 界定 元 件 的 大 概 位 置 以 便 将 辐射 
最 小 化 。 分 区 通常 是 同一 块 电路 板 上 的 不 同 区 域 。 
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图 9. 12 展示 了 印刷 电路 板 系 统 划分 为 不 同 分 区 的 例子 ， 分 区 1 包括 关 
键 部 分 ， 而 分 区 2 和 分 区 3 包括 非 关 键 部 分 。 


被 过 滤 的 接口 


Vi 
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二 二 
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9. 12 电路 板 分 区 方案 


进出 一 个 分 区 的 所 有 线路 需要 几 种 滤波 器 。 每 个 分 区 的 设计 者 应 当 清 
楚 一 个 分 区 会 发 出 什么 样 的 噪声 和 能 忍耐 什么 样 的 噪声 ， 还 应 考虑 分 区 对 
分 区 的 噪声 辐射 。 

分 区 有 很 多 种 方法 ， 图 9. 12 给 出 了 一 种 特殊 的 例子 ， 在 这 个 例子 中 ， 
电源 、 数 字 电路 和 模拟 电路 放 在 不 同 的 分 区 中 ， 从 而 将 噪声 电路 和 敏感 的 
电路 分 开 。 

图 9. 13 是 将 一 个 分 区 放 在 另 一 个 分 区 内 部 的 另 一 种 方法 。 

从 最 里 面 的 分 区 进出 的 噪声 将 通过 多 层 滤 波 器 以 对 噪声 产生 更 好 抗 干 
扰 性 。 对 于 一 个 典型 的 基于 微 控制 器 的 系统 而 言 ， 最 内 层 分 区 可 能 包含 品 
声 最 大 的 信号 ， 如 带 有 内 存 和 其 他 高 速 接口 的 微 控 制 器 。 离 开 这 个 分 区 
(分 区 1) 的 所 有 传输 线 必须 经 过 过 滤 ， 以 确保 没有 最 高 频 的 噪声 传 出 去 。 
下 一 级 过 滤 可 以 在 数字 或 模拟 分 区 (分 区 2)， 可 能 的 第 三 级 过 滤 可 以 在 
系统 输入 /输出 端口 上 (分 区 3)， 以 进一步 减少 发 出 的 噪声 ， 如 图 9. 13 
所 示 。 

下 面 给 出 分 区 时 可 供 考虑 的 一 些 更 多 指南 。 

。 微 控 制 器 等 高 速 逻辑 电路 应 当 靠近 电源 放置 ， 低 速 部 件 可 以 放 运 
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被 过 滤 的 接口 过 滤 后 的 IO 
连接 





图 9.13 电路 板 分 区 的 另 一 种 方法 


一 些 ， 而 模拟 部 件 可 以 放 得 更 远 。 这 样 的 安排 使 得 高 速 逻 辑 部 件 
几乎 没有 机 会 干扰 其 他 信号 线路 。 

。 振荡 器 应 当 远 离 模拟 电路 、 低 速 信号 和 连接 器 。 

。 微 控 制 器 应 紧 靠 稳 压 器 ， 而 稳 压 器 紧 靠 进入 电路 板 的 “电池 


电压 ”。 
确定 分 区 划分 必须 考虑 的 另 一 个 因素 是 材料 成 本 ， 因 为 这 项 技术 的 费 
用 可 能 很 高 。 


9. 6.2.7 电源 耦合 


当 逻 辑 门 发 生 翻转 时 ， 供 电线 路 就 会 产生 瞬 态 电流 。 这 些 瞬 变 电 流 必 
须 衰 减 和 过 滤 掉 。 


宇 高 的 电源 产生 的 瞬 态 电流 会 引起 地 线 和 信号 线 产生 “ 拌 动 ”电压 。 


高 的 全 会 产生 宽频 谱 范围 的 高 频 电流 ， 从 而 激励 结构 及 连 线 产生 辐射 。 流 
经 固定 电感 〈Z) 的 导体 的 电流 变化 导致 的 电压 降 为 : 


通过 减 小 电感 或 者 减少 电流 变化 可 以 减少 电压 降 。 
低 电 感 的 高 频 陶瓷 电容 器 最 为 理想 。 选 择 电 容器 要 考虑 的 重要 特性 是 
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最 大 额定 直流 电压 、 寄 生 电 感 、 寄 生 电 阻 和 过 电压 失效 机 理 。 当 在 超过 最 
大 额定 电压 的 条 件 下 使 用 时 ， 电 容器 应 当选 可 自动 修复 的 类 型 ， 如 金属 化 
聚 酯 薄膜 电容 器 。 

必须 注意 电容 器 不 适用 于 分 流 由 闪电 、 浪 涌 或 切换 大 电感 负载 产生 的 

较 大 的 瞬 变 电流 。 

去 耦 电容 用 于 以 下 两 个 目的 。 

。 对 于 吸收 或 者 提供 高 频 电 流 的 器 件 来 说 ， 它 们 是 充电 源 。 如 上 所 
述 ， 去 耦 电容 减少 电压 又 降 和 接地 漂移 。 

。 电容 器 为 电源 层 的 高 频 返 回电 流 提供 了 一 种 接地 途径 。 如 果 不 用 
电容 器 ， 则 电流 通过 输入 /输出 信号 或 电源 连接 器 返回 接地 ， 从 而 
产生 大 的 回路 ， 增 加 辐射 。 

旁 路 电容 器 在 特定 频率 下 会 产生 自 谐振 ， 这 种 现象 必须 考虑 。 

1 
/= 元 汪 
这 样 ， 有 3nH 电感 的 200pF 的 电容 器 将 在 大 约 205MHz 谐振 。 
对 于 高 于 自 谐 振 频率 的 噪声 信号 ， 旁 路 电容 器 变 为 感性 而 无 法 过 滤 这 
些 信 号 。 
最 好 是 为 每 个 元 件 都 配置 旁 路 电容 器 。 然 而 ， 如 果 无 法 为 每 个 有 效 元 
件 提供 旁 路 ， 就 可 以 将 精力 集中 在 高 频 器 件 而 忽略 频率 较 低 的 器 件 。 


9. 6. 2.8 印刷 电路 板 配 电 和 去 耦 电容 器 


配 电 系 统 的 设计 对 确保 印刷 电路 板 EMC 至 关 重要 ， 这 是 EMC 控制 的 
基础 。 

接地 和 电源 网 路 应 当 设计 为 平面 或 短 宽 线 路 。 避 免 使 用 通 孔 和 跳 线 来 
连接 不 同 的 接地 区 域 。 通 孔 和 跳 线 将 增加 电感 ， 在 电路 间 产 生 共 模 阻抗 品 
声 ， 从 而 导致 功能 退化 。 

微 控制 器 有 宽 的 电压 范围 ， 并 且 在 时 钟 脉冲 边缘 的 极 短 尖峰 会 从 电源 吸 
取 电 流 。 当 IO 线 紧 推 在 一 起 时 ， 尖 峰 可 能 会 有 较 大 的 幅 值 。 随 着 绑 在 一 起 
的 YO 线 的 数量 变化 ， 电 源 的 电流 脉冲 变化 范围 可 能 会 很 大 。 必 须 用 去 耦 电 
容 将 这 种 电流 尖 脉 冲 在 长 电源 线 中 释放 掉 (同样 如 前 所 述 )。 当 规划 接地 和 
配 电 系统 时 ， 去 耦 电容 的 位 置 〈 或 其 他 相关 滤波 器 ) 也 非常 重要 。 

图 9. 14 给 出 了 一 个 去 耦 不 充分 的 例子 。 电 容器 离 微 控制 器 过 远 以 致 
产生 大 的 电流 回路 。 结 果 噪 声 很 容易 扩散 到 电路 板 上 的 其 他 器 件 。 除 了 作 
为 大 电流 的 回路 外 ， 接 地 层 也 充当 了 这 种 噪声 的 天 线 。 
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图 9.14 ”错误 的 去 耦合 : 电容 器 离 微 控制 器 太 远 


图 9. 15 给 出 的 是 电容 器 放 在 离 微 控制 器 较 近 位 置 的 较 好 例子 。 作 为 
大 电流 回路 的 线路 并 不 是 电源 层 或 接地 层 的 部 分 ， 这样 避免 了 任何 噪声 的 
广泛 传播 。 





VDD 


图 9.15 去 耦 电容 器 靠近 微 控 制 器 


图 9. 16 给 出 了 另 一 个 改进 的 例子 ， 通 过 增加 一 个 串联 电感 器 减少 电 
源 层 的 开关 噪声 。 选 择 的 电感 器 数值 应 当 使 电压 降 可 忽略 不 计 。 





图 9. 16 ”使 用 去 耦 电容 器 和 串联 电感 器 的 情况 
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为 了 更 好 和 更 有 效 地 去 耦 ， 建 议 将 电源 线 和 接地 线 (或 引 脚 ) 紧 挨 放 
置 。 作 为 EMC 的 关键 设计 ， 应 当 尽 可 能 多 地 设计 电源 /接地 线 对 将 电流 分 
为 多 条 路 径 。 电 源 到 地 的 电流 分 流 到 许多 更 小 的 回路 中 ， 从 而 明显 改善 
EMC 性 能 。 


9. 6. 3 微 控 制 器 级 技术 


解决 噪声 问题 的 最 佳 途径 是 在 源头 。 在 大 多 数 情况 下 ， 面 向 EMC 的 
微 控制 器 增加 了 应 用 的 安全 性 和 可 靠 性 ， 实 现成 本 低 ， 可 节约 材料 成 本 。 
此 部 分 提供 了 提高 EMC 性 能 的 微 控制 器 级 技术 。 


9. 6. 3.1 多 时 钟 和 接地 


如 前 面 几 节 所 述 ， 多 个 电源 和 接地 引 脚 有 助 于 将 大 电流 分 流 到 多 条 路 
径 ， 以 避免 在 苦 电 放电 和 门 锁 事件 期 间 损 坏 有 源 逻 辑 和 电路 。 同 样 ， 较 小 
的 峰值 电流 使 得 选择 外 接 电源 - 地 去 耦 电容 器 变 得 容易 。 

选择 去 耦 电容 器 必须 依照 以 下 条 件 。 

a) 电容 器 的 容量 应 足够 大 以 在 转换 时 间 内 提供 所 需 的 电流 。 

b) 电容 器 的 容量 应 足够 小 以 使 时 钟 频 率 小 于 电容 器 的 谐振 频率 (如 
前 所 述 ) 。 

较 小 的 峰值 电流 减少 了 两 条 规则 产生 冲突 的 机 会 。 例 外 是 芯片 上 有 足 
够 数量 的 去 耦 电容 。 在 这 种 情况 下 ,地 (VSS) 应 当 比 电源 (VDD) 分 配 
更 多 引 脚 ， 而 电源 总 线 应 当 仔细 地 相互 连接 以 减少 去 耦 电容 器 与 电路 之 间 
的 阻抗 。 

此 外 ， 还 应 遵守 以 下 指南 。 

。 在 所 有 电源 /地 线 对 中 尽 可 能 是 均衡 电流 。 

。 除了 ESD 保护 需要 外 ， 应 避免 在 内 部 连接 电源 引 脚 和 接地 引 脚 。 

。 在 芯片 上 使 用 独立 的 电源 - 地 线 对 来 把 有 噪声 的 电路 与 敏感 电路 

隔离 开 来 (除了 基板 设计 指南 特别 说 明 )。 


9. 6. 3.2 ”消除 竞 态 条 件 


竞 态 条 件 定义 了 一 种 条 件 ， 即 ， 器 件 的 输出 取决 于 输入 端 几乎 同时 的 
两 个 或 多 个 事件 ， 导 致 设备 输出 的 转换 。 这 就 额外 增加 了 系统 噪声 ， 在 好 
的 EMC 设计 中 必须 避免 。 
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9. 6.3.3 降低 系统 速度 


提高 EMC 的 一 项 关键 参数 是 降低 系统 工作 频率 至 绝对 最 小 值 。 这 包 
括 主 时 钟 、 派 生 时钟 和 内 部 接口 。 

相对 于 符合 所 有 性 能 需求 的 足够 好 的 系统 频率 ， 仍 建议 对 中 断 、CPU 
处 理 时 间 等 实时 事件 以 及 一 个 时 间 窗 口内 数据 采集 等 任意 事件 顺 列 进行 详 
细 分 析 ， 以 达成 正好 符合 性 能 需求 的 最 小 时 钟 频率 。 在 完成 设计 前 可 以 使 
用 建 模 工 具 来 模拟 系统 以 提供 性 能 数据 。 


9. 6. 3.4 驱动 器 规格 


当 驱 动 器 对 于 负载 充电 的 速度 快 于 负载 所 需 的 速度 时 ， 过 快 的 沿 速度 
会 将 导致 过 冲 或 下 冲 。 快 的 转换 速率 会 导致 噪声 以 信号 反射 、 串 扰 和 接 弹 
反弹 等 形式 产生 。 

不 要 试图 使 用 最 快 的 转换 速率 和 最 大 的 驱动 电流 。 通 常 ， 厂 商 提供 指 
南 会 说 明 在 给 定 电流 激励 下 可 同时 转换 的 最 大 输出 数量 。 所 以 减少 EMI 最 
重要 的 设计 考虑 是 从 输出 及 内 部 驱动 器 获得 适当 的 上 升 时 间 和 使 峰值 电流 
最 小 化 。 


强烈 建议 使 用 转换 速率 控制 电路 以 获得 合适 的 时 转换 特性 ， 这 可 以 通 
过 慎重 选择 驱动 器 规格 来 实现 。 
9. 6. 3.5 时 钟 产 生 及 分 本 


对 于 时 钟 馈 人 全 部 模块 或 一 组 模块 的 情况 ， 当 不 需要 时 应 关闭 时 钟 及 
振 功 器 。 一 个 好 的 办 法 是 宁可 支持 各 种 低 功 耗 模式 ， 而 不 是 将 时 钟 限制 在 
较 低 的 频率 或 完全 关闭 它 。 

前 面 所 述 的 扩 频 时 钟 (SSC) ， 即 “时 钟 抖动 ”是 减少 EMI 非常 有 效 
的 办 法 。 拌 动 本 质 上 对 高 次 谐 波 更 有 效 ， 而 对 低 次 谐 波 效果 较 差 。 由 于 频 
率 偏 移 的 绝对 值 随 着 谐 波 数 线性 增加 ， 因 此 频谱 能 量 在 高 次 谐 波 上 传播 的 
范围 更 大 ， 而 测量 此 频谱 能 量 的 滤波 器 宽度 是 固定 的 。 幸 运 的 是 ， 高 频 正 
是 某 些 应 用 出 现 最 严重 错误 问题 的 地 方 。 由 于 某 些 元 件 〈 如 某 些 打印 机 的 
打印 电缆 ) 独特 的 共振 条 件 造 成 一 些 应 用 中 低频 辐射 正好 是 主要 的 噪声 
源 ， 这 时 抖动 的 效果 可 能 就 不 大 了 。 

另 一 种 有 效 的 技术 是 使 用 非 重 和 时 钟 来 处 理 EMI。 

图 9. 17 所 示 为 非 重 全 时钟 ， 即 ， 具 有 非 一 致 边沿 转换 的 时 钟 。 从 系 
统 观 点 看 ， 非 重合 时 钟 脉冲 边沿 通过 多 时 钟 系统 的 连续 脉冲 边沿 之 间 的 过 
渡 时 间 ， 有 助 于 消除 竞 态 条 件 和 亚 稳 态 问题 。 
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时 钟 A 








图 9.17 非 重 又 时 钟 脉冲 边沿 


从 EMC 的 角度 看 ， 加 入 时 钟 边沿 之 间 的 过 渡 时 间 会 降低 可 观察 到 的 
峰值 电流 和 电流 谐 波 的 峰值 幅度 。 平 均 电流 从 时 间 跨 度 上 来 看 将 保持 大 致 
相同 ， 但 幅度 和 频谱 形状 会 发 生变 化 。 

另 一 个 与 时 钟 相关 的 技术 是 调节 时 钟 的 上 升 / 下 降 时 间 至 绝对 最 小 值 。 有 
时 需要 的 变化 仅仅 是 在 时 钟 线 上 增加 一 个 串联 电阻 。 这 个 电阻 与 PCB 上 的 时 钟 
线 与 接地 层 之 间 的 固有 电容 形成 一 个 简单 的 电阻 -电容 低 通 滤波 器 。 

同样 重要 的 是 ， 避 免 在 常用 频率 下 运行 时 钟 ， 这 样 会 在 时 钟 谐 波 附 近 
产生 共振 结构 从 而 增加 噪声 。 

经 常 可 以 看 到 在 电路 板 上 多 个 高 速 区 域 中 使 用 频率 相同 的 多 个 基准 时 钟 的 
情况 。 这 将 严重 影响 EMI 性 能 ， 因 为 每 个 时 钟 依次 成 为 加 性 噪声 源 。 一 个 更 好 
的 办 法 是 使 用 单个 基准 输入 来 改进 噪声 性 能 。 如 果 单 个 基准 时 钟 不 可 行 ， 则 强 
烈 建议 使 用 不 同 频率 的 参考 时 钟 ， 以 便 将 EMI 扩展 到 多 倍 频 率 上 。 

我 们 通过 一 个 例子 来 进一步 理解 。 图 9. 18 所 示 是 具有 多 个 基准 时 钟 
输入 的 SoC， 每 个 时 钟 输入 馈 人 SoC 中 的 一 个 高 速 区 域 。 








Clk_A=150MHz 


Clk_B=125MHz 


Clk_C=100MHz 


图 9. 18 具有 不 同 基准 时 钟 频率 的 谐 波 
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基准 时 钟 (Clk_A、Clk_B、Clk_C) 特意 选择 不 同 频率 ， 以 便 在 
1. 0GHz 以 下 不 会 出 现 同 频 的 谐 波 ，Clk_B 是 8 次 谐 波 , 而 Clk_C 是 10 次 
谐 波 。Clk_A 与 Clk_C 在 1.2CHz 有 同 频 的 谐 波 ， 即 Clk_A 的 8 次 谐 波 和 
Clk_C 的 12 次 谐 波 。 这 并 不 意味 着 EMI 会 在 几 个 基 频 上 扩散 EMI， 以 便 直 
到 1.2GHz 左右 谐 波 噪声 才 会 发 生 肥 加 。 


9.6.3.6 占 空 比 考虑 


一 个 要 考虑 的 重要 问题 是 ， 如 果 占 空 比 正好 是 50% ,复杂 梯形 开关 波 
形 的 所 有 能 量 都 在 奇数 谐 波 (1、3、5、7 等 )。 这 样 ， 工 作 在 50% 的 占 空 
比 通常 是 最 坏 情 况 。 当 占 空 比 高 于 或 低 于 50% 时 ,由 于 引入 了 偶 次 谐 波 ， 
EMI 将 按 正常 情况 分 布 。 


9. 6. 3.7 降低 数据 总 线 上 的 噪声 


带宽 为 8、16、32 位 甚至 更 高 倍数 的 数据 总 线 在 电路 板 上 跨 长 距离 的 
情况 并 不 少见 ， 这 将 导致 串扰 。 
图 9. 19 给 出 了 有 助 于 提高 EMC 能 的 总 线 布局 选择 。 


EE 


图 9.19 有 助 于 提高 EMC 性 能 的 总 线 布局 选择 


“A” 是 所 有 8 条 线 紧密 排列 的 典型 总 线 布局 ， 这 样 就 会 引入 串扰 。 
“B” 则 通过 增加 数据 线 之 间 的 距离 来 降低 噪声 。 选 择 “C” 是 每 隔 两 条 数 
据 线 插入 一 条 地 线 的 方法 ， 这 种 方法 有 可 能 不 可 行 〈 如 对 高 速 数据 线 ) 或 
如 果 电 路 板 上 空间 有 限 。“D”( 接 地 线 与 每 条 数据 线 交 错 放置 ) 则 对 全 面 
降低 开关 噪声 非常 有 效 。 


9. 6.4 软件 层级 技术 


在 硬件 层级 完全 消除 瞬 态 效应 尽管 令 人 期 待 ， 但 这 不 切实 际 并 且 费 用 
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昂贵 。 本 节 重点 介绍 可 在 微 控制 器 上 配置 的 软件 技术 ， 以 预防 或 抑制 噪声 
(如 果 不 能 完全 消除 ) 。 


9.6.4.1 通用 MO 引 脚 保护 


如 图 9. 20 所 示 ， 所 有 常规 的 IO 引 脚 必须 在 内 部 有 到 地 和 电源 的 ESD 
保护 二 极 管 。 流 过 器 件 的 最 大 电流 必须 限定 在 数据 手册 中 的 “绝对 最 大 额 
定 参 数 ” 范 围 内 ， 否 则 它 将 会 危害 和 损坏 器 件 。 


VDD 


Io 引 脚 IO 模块 


GND 


图 9.20 IO 引 脚 保护 


EMI 和 ESD 控制 器 件 必须 提供 要 求 的 保护 等 级 而 不 会 减弱 输入 信号 或 
降低 接收 电路 的 特性 以 至 于 超过 产品 规范 的 要 求 。 对 于 具有 在 瞬 态 波形 的 
噪声 带宽 之 外 工作 带宽 的 电路 ， 可 以 使 用 低 通 滤 波 器 、 高 通 滤 波 器 或 带 通 
滤波 器 来 实现 保护 。 对 于 输入 的 标准 保护 是 低 通 滤波 器 ， 如 图 9. 21 所 示 。 


VDD 


微 控 制 器 


VSS 


9.21 带 有 低 通 滤波 器 的 输入 引 脚 保护 
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串联 电阻 限制 了 注入 电流 。 并 联 电容 器 把 瞬 态 电流 分 流 至 接地 系统 ， 
因为 它 要 保持 电压 在 稳 态 值 。 电 阻 和 电容 的 数值 可 根据 对 输入 信号 的 最 大 
保护 或 最 小 影响 而 变化 。 

总 之 ， 当 把 系统 中 几 个 引 脚 连接 至 同一 点 时 ， 将 VO 引 脚 设计 为 漏 极 
开路 有 利 的 。 当 然 ， 在 设计 软件 时 必须 注意 任何 时 间 只 有 一 个 引 脚 可 作为 
输出 ， 以 避免 输出 驱动 器 竞争 。 可 行 的 办 法 是 将 这 些 引 脚 配置 为 输出 漏 极 
开路 ， 以 降低 电流 竞争 的 风险 。 


9. 6. 4.2 数字 输入 引 脚 


针对 系统 中 数字 输入 比较 脆弱 的 情况 ， 使 用 软件 滤波 技术 是 很 重要 
的 ， 它 可 以 消除 由 于 外 部 噪声 导致 的 输入 引 脚 短 时 脉冲 波 干扰 。 

可 以 用 简单 的 技术 在 输入 端 读 取 预 定 的 次 数 ， 在 大 部 分 时 间 读 到 的 逻 
辑 状态 可 认为 是 正确 的 状态 。 

涉及 滤波 的 其 他 技术 是 ， 如 果 输 入 的 变化 持续 时 间 小 于 阅 值 则 过 
滤 掉 该 输入 信号 。 这 项 技术 在 IRQ 引 脚 或 键盘 中 断 (KBI) 引 脚 等 中 
断 输 入 中 特别 有 用 。 它 还 常用 在 消 拌 机 械 开 关 输 入 中 (详情 参见 
9. 6. 2.7 节 )。 


9. 6. 4. 3 数字 输出 和 关键 寄存 器 


用 户 软 件 应 当 经 常 更 新 输出 和 关键 寄存 器 ， 它 们 控制 输出 引 脚 以 确保 
任何 轻微 故障 都 会 纠正 而 不 发 生 大 问题 。 这 些 更 新 包括 : 

e 数据 定向 寄存 器 

。 可 通过 软件 修改 的 VO 模块 

。 用 于 关键 应 用 的 RAM 寄存 器 

这 些 寄存 器 的 更 新 应 当 尽 可 能 定期 进行 。 输 出 及 RAM 寄存 器 的 可 靠 
性 不 应 当 受 经 常 写 人 /更 新 的 影响 。 应 当 注意 ， 诸 如 串 行 通信 、 定 时 器 等 
功能 在 重新 初始 化 时 必须 确保 在 非 活动 状态 ， 因 为 一 些 状态 位 容易 受到 相 
应 控制 寄存 器 写 人 的 影响 。 


9.6.4.4 复位 引 脚 保护 


在 大 多 数 微 控制 器 中 ， 在 调试 或 编程 时 复位 引 脚 是 置 高 的 〈 对 低 
电 平 有 效 的 复位 来 说 ) ， 因 此 从 地 到 复位 引 脚 只 需要 保护 二 极 管 〈 见 
加 |9. 2206 
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GND 


图 9.22 复位 引 脚 保护 


在 正常 工作 模式 中 ， 复 位 是 从 外 部 驱动 的 ， 因 此 需要 另 一 级 别 的 保 
护 ， 如 图 9. 23 所 示 。 





OGND 


图 9.23 复位 引 脚 保护 


电容 器 帮助 吸收 瞬 变 电压 ， 尽 管 RC 网 路 的 实际 作用 是 复位 开关 消 拌 
和 设置 线路 保持 为 逻辑 零 的 最 短 时 间 。 

内 部 和 外 部 二 极 管 将 引 脚 电压 箱 位 在 GND -0.7V 至 VDD +0.7V 
之 间 。 
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9. 6. 4. 5 ”振荡 器 和 其 他 敏感 引 脚 


微 控制 器 上 最 脆弱 的 引 脚 通常 是 高 阻抗 模拟 引 脚 ， 如 用 在 振荡 器 电 
路 、 锁 相 环 和 模拟 信号 输入 中 的 引 脚 。 特 别 要 注意 ， 在 设计 电路 板 布 局 
时 ， 让 这 些 引 脚 远离 噪声 。 然 而 ， 类 似 于 先前 讨论 的 用 于 数字 引 脚 的 滤波 
技术 ， 也 可 应 用 于 某 些 模拟 信号 输入 引 脚 ， 如 馈 人 模 - 数 转 换 器 (ADC ) 
的 引 脚 。 在 这 种 情况 下， 分 析 转 换 值 可 确定 这 些 值 是 否 在 预期 范围 内 ; 通 
过 对 所 有 有 效 转换 简单 求 平均 数 ， 可 以 降低 大 多 数 噪声 的 影响 。 

高 频 振 功 器 是 相当 精密 的 器 件 ， 因 此 对 外 部 噪声 很 敏感 。 另 外 ， 与 其 
他 IO 引 脚 相 比 ， 振 功 器 引 脚 通常 对 ESD 更 敏感 。 


9. 6. 4.6 看 门 狗 定时 器 


对 任何 受到 噪声 影响 的 系统 ， 可 能 会 出 现代 码 跑 飞 而 使 系统 处 于 未 知 
状态 的 情况 。 一 个 设计 良好 的 看 门 狗 定 时 器 应 当 能 够 将 系统 带 回 安全 
状态 。 

有 关 任 务 和 严格 安全 性 应 用 的 代表 性 例子 是 航天 器 的 推力 控制 。 在 太 
空 执行 的 其 中 一 个 最 细致 的 操作 是 两 个 航天 器 的 对 接 。 精 确 的 方向 控制 和 
动作 保证 两 个 舱 体 准确 地 排列 ， 以 实现 对 接 。 航 天 器 推进 器 的 控制 系统 必 
须 完美 无 瑕 地 工作 。 太 空中 的 物体 也 会 遭受 严重 的 未 知 噪声 干扰 。 推 进 器 
电子 控制 单元 的 软件 崩溃 会 导致 推进 器 喷 火 时 间 过 长 或 喷 火 角度 错误 或 两 
者 兼 有 ， 从 而 导致 航天 器 相 撞 而 不 是 实现 对 接 。 因 此 ， 在 适当 的 位 置 上 应 
当 有 安全 装置 可 探测 故障 ， 并 在 推进 器 发 生 不 可 预见 的 连续 喷 火 前 将 ECU 
置 于 安全 状态 。 

另 一 个 关键 应 用 是 外 科 手 术 中 的 机 械 手 ， 这 在 先进 医疗 设备 中 越 来 越 
常见 。 这 些 系统 能 增强 医生 用 最 小 干预 就 可 以 执行 复杂 手术 的 能 力 。 在 一 
个 手术 中 ， 医 生 开始 一 个 特定 的 程序 ， 如 在 一 个 重要 器 官 中 的 细小 切口 ， 
然后 就 完全 控制 机 械 手 来 运用 手术 刀 。 系 统 中 的 噪声 可 能 会 导致 代码 跑 飞 
和 软件 故障 ， 导 致 机 械 手 不 可 预见 地 工作 ， 对 病人 构成 危险 。 系 统 必 须 从 
这 类 不 需要 的 噪声 引起 的 故障 中 恢复 正常 ， 从 而 控制 机 械 手 正确 操作 。 

以 下 是 应 当 遵守 的 一 系列 好 的 做 法 ， 以 确保 硬件 能 从 跑 飞 的 代码 状态 
中 迅速 而 可 靠 地 恢复 正常 '” 。 

。 看 门 狗 定时 器 的 宽度 应 当 能 够 覆盖 系统 中 所 有 可 用 时 钟 源 的 超时 

时 间 范 围 。 建 议 尽 可 能 使 用 最 短 的 看 门 狗 超 时 周期 以 确保 代码 跑 
飞 状态 不 会 持续 太 久 。 应 用 程序 本 身 将 规定 实际 的 COP 超时 周期 
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选择 。 
看 门 狗 定 时 器 的 时 钟 源 应 独立 于 其 监控 的 系统 的 时 钟 源 。 更 好 的 
应 当 是 给 看 门 狗 提 供 专用 的 时 钟 源 ， 如 RC 振荡 器 。 这 意味 着 即使 
系统 时 钟 由 于 某 种 原因 停止 ， 导致 系 统 挂 起 ， 看 门 狗 定时 器 仍 能 
超时 并 复位 系统 。 
。 看 门 狗 向 系统 发 出 故障 信号 的 方法 必须 是 能 自身 容错 的 。 
。 看 门 狗 的 关键 控制 和 配置 寄存 器 位 应 当 有 写 保护 ， 这 样 一 旦 设置 
好 就 不 会 被 意外 地 修改 。 
刷新 看 门 狗 的 方法 应 当 是 使 跑 飞 的 代码 意外 刷新 看 门 狗 的 机 会 最 
小 。 如 果 跑 飞 的 代码 通过 某 些 不 可 思议 的 机 会 刷新 看 门 狗 ， 看 门 
狗 将 要 么 不 知道 跑 飞 的 代码 的 情况 要 么 很 长 时 间 以 后 才 知 道 。 建 
议 不 要 仅 赁 RAM 中 的 一 个 字 节 或 一 位 或 者 状态 寄存 器 中 的 一 位 就 
刷新 看 门 狗 。 在 刷新 看 门 狗 前 应 当 对 系统 状态 进行 全 面 检 查 。 
看 门 狗 探测 失控 状态 的 反应 应 当 是 迅速 的 。 如 果 看 门 狗 要 花 太 多 
时 间 复 位 系统 ， 则 处 于 未 知 状 态 的 系统 将 可 能 对 重要 的 安全 性 应 
用 造成 许多 危害 。 回 忆 机 械 手 的 例子 ， 机 械 手 发 生 故 障 到 停止 工 
作 的 时 间 越 长 ， 病 人 的 生命 就 越 危险 。 
。 看 门 狗 的 正常 运行 应 当 是 可 测试 的 ， 以 便 确保 启动 后 它 的 功能 正 

常 。 测 试 不 应 该 花费 过 多 的 时 间 。 
。 看 门 狗 应 当 能 帮助 诊断 导致 看 门 狗 超时 的 故障 。 
对 于 软件 实现 〈 如 果 使 用 噪声 关键 应 用 程序 则 不 推荐 ) ， 应 避免 将 
看 门 狗 刷新 放 在 中 断 程序 中 。 即 使 CPU 陷入 主 程序 的 未 知 循环 中 ， 
中 断 仍 能 提供 服务 。 
任何 服务 于 看 门 狗 的 循环 应 当 能 在 有 限时 间 内 给 出 超时 状态 。 时 
间 取 决 于 系统 能 承受 CPU 错误 执行 代码 的 时 间 。 

强烈 建议 看 门 狗 符 合 还 C 60730 标准 ， 这 是 家 用 电器 的 安全 性 标准 ， 
可 确保 操作 安全 可 靠 。 

IEC 60730 论述 了 有 关 交 流 电 应 用 的 机 械 性 能 、 电 气 性 能 、 电 子 性 能 、 
使 用 环境 、 耐 用 性 、EMC 、 异 常 运行 等 情况 。 

IEC 60370 将 自动 控制 产品 分 为 三 级 。 

级 别 A: 不 要 试图 依赖 设备 的 安全 性 。 

级 别 B: 防止 受 控 设备 的 不 安全 操作 。 

级 别 C: 防止 特殊 危害 。 

遵守 正 C 的 安全 性 标准 具有 很 大 的 好 处 ， 它 对 噪声 环境 提供 了 更 好 的 
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抗 干扰 性 ， 这 也 是 现在 测量 、 工 业 等 其 他 应 用 中 参考 这 些 标 准 的 原因 。 


9. 6.4.7 非法 指令 和 非法 地 址 复位 


迅速 从 跑 飞 代码 状态 中 恢复 系统 的 另 一 个 可 能 途径 是 在 出 现 非法 指 
令 / 非 法 地 址 时 产生 复位 。 非 法 地 址 复位 是 对 内 存 较 小 的 微 控制 器 是 最 有 
效 的 ， 因 为 这 些微 控制 器 更 可 能 遇 到 跑 飞 的 代码 落 到 其 内 存 映 射 中 没有 实 
现 的 部 分 。 伴 随 着 这 些 中 断 或 复位 情况 ， 许 多 微 控 制 器 装 有 复位 状态 寄存 
器 和 中 断 状态 寄存 器 ， 它 们 有 助 于 确定 复位 来 源 或 中 断 来 源 ， 使 得 软件 能 
采取 适当 的 行动 。 
9. 6.4.8 低 电 压 检 测 / 低 电压 警告 


低 电 压 检 测 (Low Voltage Detect，LVD) 或 低 电 压 警 告 (Low Voltage 
Warming，LVW) 增加 了 器 件 的 敏感 性 ， 对 电源 线 (VDD) 的 电气 干扰 和 
传导 噪声 提供 了 更 好 的 抗 干扰 性 。 

当 芯 片 电源 (VDD) 低 于 最 小 工作 电压 时 ， 微 控制 器 的 性 能 就 无 法 保 
证 ， 就 没有 足够 的 电力 来 解码 /执行 指令 和 (或 ) 读 取 内 存 。 最 坏 的 情况 
是 ， 如 果 让 芯片 在 低 于 最 小 保证 电压 下 的 情况 工作 ， 则 写 人 内 存 或 寄存 器 
位 会 导致 数据 损坏 。 强 烈 建议 微 控 制 器 在 这 种 状态 下 应 自动 重 置 以 防止 不 
可 预测 行为 。 

如 图 9.24 所 示 ， 低 电压 检测 (LVD) 功能 应 在 VDD 电源 低 于 Vw 
(LVD) 时 产生 静态 复位 。 在 上 电 期 间 ， 微 控制 器 应 保持 在 复位 状态 直到 
电压 上 升 到 Vi。(LVD) 之 上 ， 从 而 保证 上 电 和 断 电 时 的 安全 。 

值得 注意 的 是 ， 电 压 下 降 的 fa (LVD) 参考 值 要 一 直 低 于 加 电 电 压 
V;。(LVD) 参考 值 ， 以 避免 MCU 开始 运行 并 吸收 电流 时 产生 的 寄生 
复位 。 

LVD 阐 值 ( 升 或 降 ) 应 当 是 可 编程 的 ， 以 为 应 用 提供 充分 的 灵活 
性 。LVD 还 允许 器 件 在 没有 任何 外 接 复位 电路 时 使 用 ， 以 节省 电路 板 
成 本 。 

低 电 压 警告 (Low Voltage Warming，LVW) 通过 确保 微 控制 器 在 电源 
受 外 部 噪声 干扰 时 安全 运行 来 进一步 改进 抗 干扰 性 。 在 LVD 产生 系统 复位 
前 ，LVD 能 让 系统 产生 预先 警告 (通过 产生 一 个 中 断 ) 。 

LVW 的 工作 情况 如 图 9. 24 所 示 。 在 电压 下 降 期 间 ， 当 电压 低 于 Ti 
(LVW) 时 ， 则 产生 中 断 ， 用 户 能 在 中 断 程 序 中 关闭 应 用 直到 电源 达到 器 
件 的 正常 电压 。 
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低 电压 警告 
a 微 控制 器 未 复位 时 便 掉 电 





LVW 中 断 请 求 | 
( 低 电 平 有 效 ) 人 


LVD 复 位 
〈 低 单 平 有 效 ) 


图 9.24 芯片 电源 的 LVDVLVW 监控 


由 于 LVD 中 所 述 的 类 似 原因 ， 在 电压 下 降 期 间 LVW 触发 电压 “Ti 
(LVW) ”一直 低 于 上 电 期 间 的 LVW 跳 变 电压 “VV,。(LVW)”。 

系统 应 当 人 允许 用 户 对 LVD 和 LVW 的 触发 范围 进行 编程 以 取得 最 大 灵 
活性 ， 而 不 是 使 用 LVD 和 LVW 固定 跳 变 点 。 例 如 ， 在 电压 降 到 LVD 跳 变 
点 和 系统 复位 前 ， 某 些 应 用 可 能 想 在 LVW 中 断 程序 中 将 重要 数据 由 内 部 
存储 器 保存 至 外 部 EEPROM ( 电 可 擦 只 读 存 储 器 ) 中 。 编 程 时 把 LVW 和 
LVD 跳 变 点 之 间 的 时 间 多 留 一 点 可 使 得 系统 有 足够 的 时 间 来 将 所 有 数据 存 
储 到 EEPROM 并 采取 必需 的 行动 用 于 安全 恢复 。 有 很 多 其 他 的 例子 可 说 明 
这 点 是 非常 有 用 的 。 


9. 6.5 其 他 技术 


9. 6. 5.1 多 电源 和 接地 引 脚 


相 邻 的 接地 和 电源 引 脚 、 多 个 接地 和 电源 引 脚 、 将 电源 和 接地 引 脚 放 
在 中 心 都 有 助 于 将 电源 与 接地 电流 路 径 间 的 互感 最 大 化 ， 并 将 自 感 最 小 
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化 ， 可 以 减少 电源 电流 的 回路 面积 ， 使 去 耦 工作 更 有 效 ， 如 9. 6. 2.7 节 所 
述 。 这 减少 了 EMC 和 接地 抖动 的 问题 。 


9. 6. 5.2 使 用 最 低频 率 的 技术 


减少 电磁 干扰 的 另 一 个 关键 因数 是 选择 元 件 〈 如 存储 器 ) 的 最 低频 率 
的 技术 。 设 计 者 必须 保证 要 选择 的 较 低 频率 技术 能 满足 时 序 和 性 能 目标 ， 
因为 通常 较 低频 率 技术 都 会 有 性 能 限制 。 关 键 是 选择 满足 性 能 指标 的 较 低 
频率 技术 ， 而 不 是 不 加 细致 考虑 就 选择 较 高 频率 技术 。 频 率 越 低 越 能 减 
少 EMI。 


9.7 总 结 


如 果 不 处 理 ， 多 余 的 辐射 或 EMI 将 产生 严重 问题 。 设 计 好 的 EMC 很 
重要 。 本 章 提供 了 多 种 不 同 抽象 层次 的 指南 来 改善 图 9.25 中 总 结 的 EMC 
问 题 D 

然而 ， 必 须 注意 ， 通 常 物美 价 廉 的 选择 是 在 源头 处 理 问题 。 





















软件 层 / 其 他 
Eo 
驱动 大 小 “降低 系统 速度 
时 钟 产 生 及 分 布 占 空 比 控制 微 控制 器 层 
数据 总 热 上 的 降 虽 Fe ___ 
源 过 滤 器件 布局 
线路 布线 “电源 辜 合 。 分 区 创建 地 级 
电源 分 配 去 耦 电容 
系统 级 


图 9.25 影响 瞬 态 干扰 的 因素 


迈 向 数字 电路 设计 系统 工程 师 必 读 的 一 本 书 


本 书 的 主要 内 容 涉 及 时 钟 和 复位 、 多 时 钟 域 设计 、 时 钟 分 频 器 、 低 功 耗 设计 技术 、 流 水 
线 技 术 、 字 节 顺 序 、 消 抖 技术 和 电磁 兼容 性 等 方面 。 第 1 章 介 绍 亚 稳 态 的 相关 内 容 。 第 2 章 介 
绍 同步 设计 的 时 钟 技术 ， 并 提出 可 行 的 时 钟 方案 ， 此 外 也 介绍 了 系统 复位 策略 。 第 3 章 介绍 多 
时 钟 设计 的 问题 和 处 理 方法 ， 几 种 可 能 的 跨 时 钟 域 情况 和 跨 时 钟 域 数据 传输 方法 等 。 第 4 章 介 
绍 奇 数 、 偶 数 、 小 数 分 频 电 路 的 实现 和 对 优 缺 点 的 权衡 。 第 5 章 介 绍 数字 电路 功 耗 来 源 ， 并 分 
- 别 从 系统 级 、 体 系 结构 级 、 寄 存 器 传输 级 和 晶体 管 级 提出 一 系列 降低 功 耗 的 方法 。 第 6 章 介 绍 
流水 线 的 基本 原理 、 性 能 的 增加 和 导致 的 冒险 。 第 7 章 讨论 使 用 最 佳 字 节 顺序 的 方法 。 第 8 章 
介绍 典型 的 开关 行为 和 软 硬 件 消 拌 技术 。 第 9 章 介绍 电磁 干扰 的 原理 、 规 程 、 标 准 和 认证 ， 电 
磁 干 扰 的 影响 因素 和 减少 电磁 干扰 的 方法 。 


时 


本 书 特点 : 


@ 本 书 实践 性 强 ， 摆 脱 了 繁杂 的 公式 ， 从 工程 角度 对 技术 原理 进行 解释 ， 便 于 读者 掌握 
技术 ， 同 时 又 能 使 读者 从 一 定 深度 理解 和 应 用 技术 。  . 

@ 每 章 一 专题 ， 各 成 体系 ， 同 时 全 书 系统 性 很 强 ， 能 使 读者 从 整体 上 建立 数字 电路 设计 
的 知识 架构 ， 在 设计 电路 时 从 各 个 角度 实现 功 耗 、 面 积 和 性 能 的 权衡 优化 ， 满 足 设计 


目标 。 
e 涵盖 EMC、 低 功 耗 技术 ( 如 DVFS 技 术 ) 、 消 拌 等 专题 性 内 容 ， 这 些 内 容 在 其 他 书籍 
中 鲜 有 提 到 。 


e 配 图 丰富 ， 不 仅 有 利于 初学 者 学 习 ， 而 且 适 合 中 高 级 读者 查阅 和 深入 理解 ， 快 速 应 用 。 
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